就在上星期,微软继推出 new bing 之后,在 AIGC 领域再爆重磅炸弹:推出比 ChatGPT 愈加万能的 AI —— AI–Kosmos-1

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

Kosmos,该词源于希腊语 kosmos,意思是:宇宙、调和、表明一个有序且调和的体系,与别的一个单词 chaos (混乱)相对。

怎么读?

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

本瓜:科哦日摸斯~~

ChatGPT 只能是纯文本对话,而这个 Kosmos-1 可以处理文本、音频、图画和视频等内容!!

ChatGPT 是【大型言语模型】(LLM) ,Kosmos-1 是【多形式大型言语模型】(MLLM)

来看看它的表现,一图胜千言:

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

CRAZY,在原先文本对话的基础上,再加图片的了解、音频的了解等,确实更进一步。

它原理怎么?

咱们用魔法打败魔法,让兄弟产品 new bing 来作解说:

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

原理还是有点复杂,首要的观点:

KOSMOS-1 骨干根据 Transformer 的因果言语模型,整合了言语、视觉、言语等模态的输入,关于连续信号模态(例如图画和音频),将输入表明为离散编码。

KOSMOS-1 借助了 PyTorch 结构,这个结构是一个深度学习的优化张量库,可使用 GPU 和 CPU 进行核算。

PyTorch 供给了灵敏的动态核算图、自动求导功用、分布式练习和部署等特性,咱们可以用它来构建各种神经网络模型,如卷积神经网络、循环神经网络、变分自编码器等。。。

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

Kosmos-1 在哪体验?

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了

现在它还只是一个研究项目,未商用。最新进展在:

  • Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning – MarkTechPost

  • Microsoft Introduces Kosmos-1: A Multimodal Large Language Model That Can Perceive General Modalities, Follow Instructions, And Perform In-Context Learning – MarkTechPost

别的不说,微软这波确实走在了前头,首先它们以最快的速度引进 GPT 3.5 到自家 Edge 浏览器中,推出 new bing ,狂拉一波浏览器的使用率,之前这个基本被 Google 吞占了。

然后,又推出 Kosmos-1,将 AI 与图片剖析、音频剖析结合,可看出其野心。

前两天在 YOUTUBE 上看到一个博主说:微软正准备将 GPT 整合到自己的各类工具中,比如文档写作 office、onenote 等等,这必将带来又一波波爆炸式的产品增加。

凭借 AIGC,微软这波或能弯道超车,在 AI 应用上,超越谷歌、甲骨文等公司。

微软这波又赢了~~

ChatGPT 不过如此,Kosmos-1 更胜一筹?微软这波又赢了


OK,以上便是本篇共享,希望各位工友喜欢~ 欢迎点赞、保藏、评论

我是安东尼 100 万人气前端技能博主 INFP 写作品格坚持 1000 日更文 ✍ 重视我,安东尼陪你一起度过漫长编程年月

加我微信 ATAR53,拉你入群,定时抽奖、粉丝福利多多。只学习结交、不推文卖课~


本文正在参加「金石计划」