2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测！

一年前的今天，榜首版天工大模型正式对外发布上线，一年来咱们不断迭代模型，迭代使用产品，模型和使用都越做越好，以此回报广阔用户的支持。

「天工3.0」具有4000亿参数，逾越了3140亿参数的Grok-1，是全球最大的开源MoE大模型。 「天工3.0」在语义了解、逻辑推理、通用性、泛化性、不确定性知识、学习才能等范畴具有打破性的功用提升，数学/推理/代码/文创才能提升逾越30%。

（天工3.0模型参数逾越Grok-1，成全球最大开源MoE专家混合大模型）

强壮的模型技能实力赋予「天工3.0」超强的功用体现。在MMBench等多项威望多模态测评成果中，「天工3.0」逾越GPT-4V，全球抢先 。

（天工3.0多模态功用逾越GPT-4V，全球抢先）

同时，「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今天面向全社会敞开公测。「天工SkyMusic」是我国首个音乐SOTA模型，更是我国的自研大模型技能榜首次在AIGC范畴领跑全球。

（天工SkyMusic归纳功用逾越Suno V3，获得音乐大模型SOTA，领跑全球）

天工SkyMusic：我国首个音乐AIGC SOTA模型

此前，大模型已经在文本、图画等多个技能范畴获得打破，带来工业全面变革。但是，在AI音乐生成范畴，全球迟迟等不到一款产品，开启「音乐ChatGPT时刻」。

这是因为一直以来，AI音乐职业大量研讨都集中在符号音乐生成技能路线上，并且大多只能完结无人声背景音乐（Background Music，BGM） 的生成，音乐的质量、效果、审美都远远达不到可用水平，工业迟迟未能迸发。

（「天工SkyMusic」自研AI音乐大模型技能架构）

与职业主流途径不同，「天工SkyMusic」采用自研大模型音乐音频生成技能路线。这一路线直接经过大模型技能完结乐器、人声、旋律、音量、音符的一体化端到端音乐生成，技能难度极大，全球只有包括昆仑万维在内的极少数顶尖玩家参与。

在与海外顶尖的AI音乐大模型Suno V3的横向测评中，「天工SkyMusic」在人声&BGM音质、人声天然度、发音可懂度等范畴明显抢先对手，并以6.65分的归纳得分逾越Suno V3， 成为全球AI音乐SOTA模型。

此外，「天工SkyMusic」还具有首创的参考音乐生成与方言歌曲生成才能。

参考音乐生成：用户可上传自有参考音乐，或挑选「天工SkyMusic」资料库中现有的参考音乐，然后生成风格、唱腔相似的歌曲，进一步下降音乐大模型的使用门槛，让不熟悉乐理知识的用户也能轻松玩转。

方言歌曲生成：「天工SkyMusic」生成的音乐不仅在人声天然度、发声可懂度等范畴体现优秀，更可以支持粤语、成都话、北京话等众多方言，让用户可以更自由地完结音乐表达，传达方言文明。

「天工SkyMusic」是我国首个揭露可用的AI音乐生成模型，更是我国自研大模型技能榜首次在AIGC范畴领跑全球。

当时，在文本大模型范畴，OpenAI招引了全球的注意力；但是在AI查找、AI音乐生成等细分范畴，我国玩家们正在奋勇前行，不断经过自研技能获得细分范畴顶尖的SOTA体现，一起建设我国大模型工业，打造自主可控的大模型工业生态。

天工3.0：4000亿参数，全球最大开源MoE大模型

在上一代「天工2.0」MoE大模型的抢先基础上，「天工3.0」完结了全面的功用晋级，采用了4000亿级参数MoE混合专家模型架构，是目前全球模型参数最大、功用最强的开源MoE模型。

「天工3.0」的逻辑推理才能、语义了解才能、应对杂乱需求才能、内容创造才能全面晋级，并新增了多轮查找与归纳东西调用、图表制作、研讨形式、增强形式、改图扩图等多项AI才能，为用户带来全新AI体会。

多轮查找与归纳东西调用： 「天工3.0」针对模型独立规划、调用、组合外部东西及整合信息的才能进行了专项练习，使其可以独立生成并调用代码，完结包括工业研讨、产品横评、信息分析、图片生成、图表制作等多种杂乱用户需求。

同时，「天工3.0」可以经过强壮的语义了解才能将用户使命拆解成细分环节，实时判别是否需求联网或调用东西，进行单轮或多轮的联网查找、东西调用，完结包括多轮查找、热点信息分析、图片生成等杂乱用户需求。

（Query：查询最新我国历史电影票房排行，图表展现）

图表制作： 「天工3.0」全面提高了逻辑推理才能与用户天然语言Query的了解才能，使其可以更精准地判别用户需求，独立生成并调用代码，结合文本需求实时进行内容分析及图表构建，为用户带来更直观、高效的对比成果。

（Query：北京、上海、重庆哪个好玩？）

多轮查找、归纳东西调用、图表制作 等都是「天工3.0」所独有的大模型归纳才能，其从底层打通了「天工3.0」的AI查找、AI对话、AI代码生成、AI图片识别、AI图画生成等底层才能，经过语义识别才能直接触发，为用户带来更加快捷、高效的AI体会，成为真正的AI生产力东西。

此外，「天工3.0」中还增加了研讨形式、增强形式、改图扩图等多项AI才能。

研讨形式： 在研讨形式中，「天工3.0」可以围绕用户的某个简单指令进行相关问题的延伸，主动生成研讨大纲、图谱、实践总结、思维导图，协助用户快速明晰地掌握核心内容，完结用户杂乱的研讨需求。

（Query：康乾盛世年代）

增强形式： 在增强形式中，「天工3.0」可以针对用户的杂乱Query进行拆解、细化、并进行追问、信息了解与补全，使其在天然语义了解方面功用更强，面临不确定性知识时体现更好，可以更精准、高效地满意用户需求。

（Query：2024年春节档电影；「天工3.0」了解并追问用户需求）

改图扩图 ：「天工3.0」多模态功用获得全面打破，逾越GPT-4V，归纳排名全球榜首。在强壮的技能底座支持下，「天工3.0」的AI绘图才能新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功用。

（「天工3.0」的AI改图、修图、扩图等功用）

关于昆仑万维

自去年4月17日「天工」大模型正式推出以来，昆仑万维已围绕「天工」系列大模型建起AI大模型、AI查找、AI音乐、AI视频、AI社交、AI游戏等AI事务矩阵，是国内模型技能与工程才能最强、布局最全面的人工智能科技企业之一。

这一年里，除了对「天工」系列基座大模型进行不断晋级迭代，昆仑万维还推出了国内榜首款AI查找引擎「天工AI查找」、开源了百亿级大语言模型「天工Skywork-13B」、推出国内抢先的AI Agent开发平台「天工SkyAgents」等一系列前沿大模型产品。

当时，「天工」系列大模型已集成了AI音乐、AI查找、AI写作、AI长文本阅览、AI画图、AI语音合成、AI漫画创造、AI图片识别、AI代码写作、AI表格生成等多项才能，并将在未来加入AI视频功用 ，对标“超级使用”，成为人工智能年代的“超级大模型”（Super Model） 。在“完结通用人工智能，让每个人更好地塑造和表达自我”的公司使命驱动下，昆仑万维将一直致力于AI技能与产品的创新开拓，不断提高AI产品的用户体会，与用户、研讨人员、开发者们携手，共创国产大模型的未来。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

中国首个音乐SOTA模型「天工音乐大模型」今日公测

天工SkyMusic：我国首个音乐AIGC SOTA模型

天工3.0：4000亿参数，全球最大开源MoE大模型

近期文章

近期评论