人民的人工智能——大语言模型StableLM完全开源

4月20日，Stability AI发布了一款新的开源言语模型StableLM。该模型的Alpha版别有30亿和70亿参数，后续还有150亿和650亿参数模型。开发人员能够出于商业或研究意图自由查看、运用和调整StableLM基本模型，但需求遵守CC BY-SA-4.0答应的条款。

2022年，Stability AI公开发布了Stable Diffusion，这是一种革命性的图像模型，给出了私有AI的透明、敞开和可扩展的代替方案，现在数以千计的图像东西和运用程序运行在Stable Diffusion之上。跟着StableLM模型套件的推出，所有人都能运用得了根底人工智能技术，人工智能的普及化迈出了重要一步。新发布的StableLM能够生成文本和代码，并将为一系列下游运用供给支撑。模型也可经过恰当的练习供给很高的功能，能够在Hugging Face上先行体验。

StableLM的发布建立在与非营利性研究中心EleutherAI的合作根底之上，早期开源的言语模型包含GPT-J、GPT-NeoX和Pythia套件，它们都在Pile开源数据集进步行了练习。最近开源的言语模型，比方Cerebras-GPT和Dolly-2，也都建立在这些成果之上。

StableLM是在Pile的新试验数据集上练习的，比之前的数据集大了三倍，包含1.5万亿个分词。更翔实的有关数据集的信息会择机发布。这个数据集的丰富性使StableLM在会话和编码任务中表现出惊人的高功能，尽管参数量比GPT-3小很多（GPT-3有1750亿个参数）。

Stability AI还方案发布一个ChatGPT的开源竞赛对手——StableChat。ChatGPT的出现让对话机器人非常盛行，现在对应的开源代替方案叫Open Assistant。新发布的StableChat会成为ChatGPT的直接竞赛对手，不仅能够了解任务，还能够与第三方系统交互并动态检索信息以完成任务。StableChat运用Python、TypeScript和JavaScript构建，也是LAION（大规模人工智能敞开网络方案）的一部分。让人拍手称快的是代码和模型在Apache 2.0答应证下授权，练习数据也会在CC BY 4.0答应下发布，这意味着能够免费运用和修改。未来几周聊天机器人的发布肯定会激增。

经过引进一套全新、开源、精调的大型言语模型，Stability AI在人工智能领域正在培养着一个多样化和竞赛力的生态系统。这种剧烈的竞赛能够为开发人员和研究人员带来加快的立异、更好的功能和快捷的东西，最终使普罗大众受益。人工智能领域的扩张速度的确是比以往任何时候都快，像StableLM这样的发展，人工智能只会变得愈加激动人心！准备投入言语模型的未来吧，Stability AI将引领潮流！

开源的力量来自任何人和任何地方的立异，它像一个均衡器，唆使底层自下而上的运动，并不是强加给企业的社会战略。StableLM在透明度、可访问性和支撑性的承诺值得支撑。这么做的意图不是打造一个AI霸主；要点应当是帮助用户真实实现目标的实际效果。

正所谓公民的人工智能为公民。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

人民的人工智能——大语言模型StableLM完全开源

近期文章

近期评论