4月20日,Stability AI发布了一款新的开源言语模型StableLM。该模型的Alpha版别有30亿和70亿参数,后续还有150亿和650亿参数模型。开发人员能够出于商业或研究意图自由查看、运用和调整StableLM基本模型,但需求遵守CC BY-SA-4.0答应的条款。

2022年,Stability AI公开发布了Stable Diffusion,这是一种革命性的图像模型,给出了私有AI的透明、敞开和可扩展的代替方案,现在数以千计的图像东西和运用程序运行在Stable Diffusion之上。跟着StableLM模型套件的推出,所有人都能运用得了根底人工智能技术,人工智能的普及化迈出了重要一步。新发布的StableLM能够生成文本和代码,并将为一系列下游运用供给支撑。模型也可经过恰当的练习供给很高的功能,能够在Hugging Face上先行体验。

StableLM的发布建立在与非营利性研究中心EleutherAI的合作根底之上,早期开源的言语模型包含GPT-J、GPT-NeoX和Pythia套件,它们都在Pile开源数据集进步行了练习。最近开源的言语模型,比方Cerebras-GPT和Dolly-2,也都建立在这些成果之上。

StableLM是在Pile的新试验数据集上练习的,比之前的数据集大了三倍,包含1.5万亿个分词。更翔实的有关数据集的信息会择机发布。这个数据集的丰富性使StableLM在会话和编码任务中表现出惊人的高功能,尽管参数量比GPT-3小很多(GPT-3有1750亿个参数)。

Stability AI还方案发布一个ChatGPT的开源竞赛对手——StableChat。ChatGPT的出现让对话机器人非常盛行,现在对应的开源代替方案叫Open Assistant。新发布的StableChat会成为ChatGPT的直接竞赛对手,不仅能够了解任务,还能够与第三方系统交互并动态检索信息以完成任务。StableChat运用Python、TypeScript和JavaScript构建,也是LAION(大规模人工智能敞开网络方案)的一部分。让人拍手称快的是代码和模型在Apache 2.0答应证下授权,练习数据也会在CC BY 4.0答应下发布,这意味着能够免费运用和修改。未来几周聊天机器人的发布肯定会激增。

经过引进一套全新、开源、精调的大型言语模型,Stability AI在人工智能领域正在培养着一个多样化和竞赛力的生态系统。这种剧烈的竞赛能够为开发人员和研究人员带来加快的立异、更好的功能和快捷的东西,最终使普罗大众受益。人工智能领域的扩张速度的确是比以往任何时候都快,像StableLM这样的发展,人工智能只会变得愈加激动人心!准备投入言语模型的未来吧,Stability AI将引领潮流!

开源的力量来自任何人和任何地方的立异,它像一个均衡器,唆使底层自下而上的运动,并不是强加给企业的社会战略。StableLM在透明度、可访问性和支撑性的承诺值得支撑。这么做的意图不是打造一个AI霸主;要点应当是帮助用户真实实现目标的实际效果。

正所谓公民的人工智能为公民