2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!

我国首个音乐SOTA模型「天工音乐大模型」今天公测

一年前的今天,榜首版天工大模型正式对外发布上线,一年来咱们不断迭代模型,迭代使用产品,模型和使用都越做越好,以此回报广阔用户的支持。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

「天工3.0」具有4000亿参数,逾越了3140亿参数的Grok-1,是全球最大的开源MoE大模型。 「天工3.0」在语义了解、逻辑推理、通用性、泛化性、不确定性知识、学习才能等范畴具有打破性的功用提升,数学/推理/代码/文创才能提升逾越30%。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(天工3.0模型参数逾越Grok-1,成全球最大开源MoE专家混合大模型)

强壮的模型技能实力赋予「天工3.0」超强的功用体现。在MMBench等多项威望多模态测评成果中,「天工3.0」逾越GPT-4V,全球抢先

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(天工3.0多模态功用逾越GPT-4V,全球抢先)

同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今天面向全社会敞开公测。「天工SkyMusic」是我国首个音乐SOTA模型,更是我国的自研大模型技能榜首次在AIGC范畴领跑全球。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(天工SkyMusic归纳功用逾越Suno V3,获得音乐大模型SOTA,领跑全球)

天工SkyMusic:我国首个音乐AIGC SOTA模型

此前,大模型已经在文本、图画等多个技能范畴获得打破,带来工业全面变革。但是,在AI音乐生成范畴,全球迟迟等不到一款产品,开启「音乐ChatGPT时刻」

这是因为一直以来,AI音乐职业大量研讨都集中在符号音乐生成技能路线上,并且大多只能完结无人声背景音乐(Background Music,BGM) 的生成,音乐的质量、效果、审美都远远达不到可用水平,工业迟迟未能迸发。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(「天工SkyMusic」自研AI音乐大模型技能架构

与职业主流途径不同,「天工SkyMusic」采用自研大模型音乐音频生成技能路线。这一路线直接经过大模型技能完结乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技能难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。

在与海外顶尖的AI音乐大模型Suno V3的横向测评中,「天工SkyMusic」在人声&BGM音质、人声天然度、发音可懂度等范畴明显抢先对手,并以6.65分的归纳得分逾越Suno V3, 成为全球AI音乐SOTA模型

此外,「天工SkyMusic」还具有首创的参考音乐生成方言歌曲生成才能。

参考音乐生成:用户可上传自有参考音乐,或挑选「天工SkyMusic」资料库中现有的参考音乐,然后生成风格、唱腔相似的歌曲,进一步下降音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。

方言歌曲生成:「天工SkyMusic」生成的音乐不仅在人声天然度、发声可懂度等范畴体现优秀,更可以支持粤语、成都话、北京话等众多方言,让用户可以更自由地完结音乐表达,传达方言文明。

「天工SkyMusic」是我国首个揭露可用的AI音乐生成模型,更是我国自研大模型技能榜首次在AIGC范畴领跑全球

当时,在文本大模型范畴,OpenAI招引了全球的注意力;但是在AI查找、AI音乐生成等细分范畴,我国玩家们正在奋勇前行,不断经过自研技能获得细分范畴顶尖的SOTA体现,一起建设我国大模型工业,打造自主可控的大模型工业生态

天工3.0:4000亿参数,全球最大开源MoE大模型

在上一代「天工2.0」MoE大模型的抢先基础上,「天工3.0」完结了全面的功用晋级,采用了4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、功用最强的开源MoE模型。

「天工3.0」的逻辑推理才能、语义了解才能、应对杂乱需求才能、内容创造才能全面晋级,并新增了多轮查找与归纳东西调用图表制作研讨形式增强形式改图扩图等多项AI才能,为用户带来全新AI体会。

多轮查找与归纳东西调用: 「天工3.0」针对模型独立规划、调用、组合外部东西及整合信息的才能进行了专项练习,使其可以独立生成并调用代码,完结包括工业研讨、产品横评、信息分析、图片生成、图表制作等多种杂乱用户需求。

同时,「天工3.0」可以经过强壮的语义了解才能将用户使命拆解成细分环节,实时判别是否需求联网或调用东西,进行单轮或多轮的联网查找、东西调用,完结包括多轮查找、热点信息分析、图片生成等杂乱用户需求。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(Query:查询最新我国历史电影票房排行,图表展现)

图表制作: 「天工3.0」全面提高了逻辑推理才能与用户天然语言Query的了解才能,使其可以更精准地判别用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比成果。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(Query:北京、上海、重庆哪个好玩?)

多轮查找、归纳东西调用、图表制作 等都是「天工3.0」所独有的大模型归纳才能,其从底层打通了「天工3.0」的AI查找、AI对话、AI代码生成、AI图片识别、AI图画生成等底层才能,经过语义识别才能直接触发,为用户带来更加快捷、高效的AI体会,成为真正的AI生产力东西。

此外,「天工3.0」中还增加了研讨形式、增强形式、改图扩图等多项AI才能。

研讨形式: 在研讨形式中,「天工3.0」可以围绕用户的某个简单指令进行相关问题的延伸,主动生成研讨大纲、图谱、实践总结、思维导图,协助用户快速明晰地掌握核心内容,完结用户杂乱的研讨需求。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(Query:康乾盛世年代)

增强形式: 在增强形式中,「天工3.0」可以针对用户的杂乱Query进行拆解、细化、并进行追问、信息了解与补全,使其在天然语义了解方面功用更强,面临不确定性知识时体现更好,可以更精准、高效地满意用户需求。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(Query:2024年春节档电影;「天工3.0」了解并追问用户需求)

改图扩图 「天工3.0」多模态功用获得全面打破,逾越GPT-4V,归纳排名全球榜首。在强壮的技能底座支持下,「天工3.0」的AI绘图才能新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功用。

我国首个音乐SOTA模型「天工音乐大模型」今天公测

(「天工3.0」的AI改图、修图、扩图等功用)

关于昆仑万维

自去年4月17日「天工」大模型正式推出以来,昆仑万维已围绕「天工」系列大模型建起AI大模型、AI查找、AI音乐、AI视频、AI社交、AI游戏等AI事务矩阵,是国内模型技能与工程才能最强、布局最全面的人工智能科技企业之一。

这一年里,除了对「天工」系列基座大模型进行不断晋级迭代,昆仑万维还推出了国内榜首款AI查找引擎「天工AI查找」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内抢先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。

当时,「天工」系列大模型已集成了AI音乐、AI查找、AI写作、AI长文本阅览、AI画图、AI语音合成、AI漫画创造、AI图片识别、AI代码写作、AI表格生成等多项才能,并将在未来加入AI视频功用 ,对标“超级使用”,成为人工智能年代的“超级大模型”(Super Model) 。在“完结通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将一直致力于AI技能与产品的创新开拓,不断提高AI产品的用户体会,与用户、研讨人员、开发者们携手,共创国产大模型的未来。