随着AI的大火,最近AI圈可谓风云际会,各方大佬纷繁上台。在3月14日,GPT-4的发布会圆满结束,3月15日,百度的李彦宏也做了文心一言的发布会,没看过的小伙伴,能够在网上搜搜发布会的视频。

“文心一言”各种梗图

GPT-4 VS 文心一言,百度的未来在哪里?

百度真“人工”智能

机敏的网友让GPT-4点评文心一言,演出实际版的同行相轻

发布会上李彦宏步履蹒跚,表情略显紧张,没有往日的自傲沉着。那么百度的文心一言和GPT比较究竟实力如何?是骡子是马,我们拉出来遛遛。

GPT-4 VS 文心一言

接下来主要从

多模态生成,数理逻辑核算,编程方面,拟人化,算力方面,中文了解,运用生态

等方面剖析下究竟谁强谁弱

GPT-4

OpenAI老板Sam Altman点评GPT-4是现在为止最强的AI,根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,它的输入能够是文字(上限2.5万字),还能够是图画

最令人惊奇的是只需要简单在纸上画一个网站的草稿图,拍一张照片上传给GPT-4,它就能够立马生成网站的HTML代码!(以后程序员真要赋闲了

OpenAI自称:在各种专业和学术基准上和人类相当!敢这么狂妄,背后仍是有东西的!

多模态才能

所谓多模态才能,即能够接受图画输入并了解图画内容,而且可接受的文字输入长度也增加到3.2万个字符(约2.4万单词)。比方模仿律师考试,GPT-4取得了前10%的好成绩,比较之下GPT-3.5是倒数10%,做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)

看图才能能够用来解说表情包、梗图

发问这张图哪里好笑?GPT-4能够按顺序描绘出每一格的内容,并总结出笑点:

用巨大的过时VGA接口给细巧的现代智能手机充电

数理逻辑核算

发GPT-4能够了解图表中数据的意义,并做进一步核算

编程方面

发布会直播上,OpenAI总裁现场表演了一波GPT-4给代码修Bug

出现问题啥也不用想,直接把2.4万字的程序文档一股脑扔给GPT-4就行。你只需要精通CV(复制粘贴)大法即可

而且能在几秒钟内瞬间得到解决办法

拟人化

GPT-4还开放了一个运用功能,答应修正“体系提示”,使其感觉更像真人一样!之前ChatGPT的答复总是冗长而平淡,这是因为体系提示中规则了“你只是一个语言模型……你的常识截止于2021年9月。现在经过修正“体系提示”,GPT-4就能够展现出更多样的性情,比方扮演苏格拉底

运用生态

必应早就用上了GPT-4,并得到了微软方面的证实

微软给OpenAI供给超算服务招引企业来运用Azure练习自己的大模型,同时直接在Azure中供给OpenAI模型服务(Azure OpenAI Service),此前包含GPT-3、Codex和DALLE 2等模型,都现已接入Azure

中文了解

GPT-4在中文了解方面的确略胜一筹。

文心一言

和GPT-4一样,文心一言是一个多模态大模型。李彦宏会上展现了文心一言具备的5种才能,包含

文学创作、商业案牍创作、数理逻辑核算、中文了解、多模态生成

文学创作

在文学创作上,李彦宏先来了一个最简单的发问,问《三体》作者是哪里人?先让文心一言介绍一下大刘,“毕竟我(文心一言)和刘慈欣是老乡嘛,都来自阳泉”

成果大错特错,直接把刘慈欣的老家破绽百出到了湖北省洪湖市

商业案牍创作

比方给新公司起个姓名,而且这个姓名它还有理有据,有迹可循

中文了解

发布会上,李彦宏向观众展现了文心一言对中文的了解才能,并自傲地说:文心一言对中国文化的了解,理应超出任何一个预练习大模型

为了证明这一点,李彦宏输入了一个问题:“洛阳纸贵。究竟有多贵?”,文心一言不只展现了历史渊源,还介绍了这个成语背后的经济学原理

我们再来问问GPT-4呢

在标准化的答复方面两者好像旗鼓相当

那么,难度再提高下,看看二者写藏头诗的才能

GPT-4没有真实了解“藏头诗”的意义

在中文了解上,属实是文心一言“小胜一筹”了。不过在英文上,李彦宏也承认,虽然文心一言也能处理,但才能是显著不如中文的。

数理逻辑核算

数学思维才能方面,文心一言处理的数学问题不算复杂,是小学常见的鸡兔同笼问题

有趣的是,李彦宏现场展现的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。看起来更具拟人化

李彦宏表明,这些题“不敢说百分之一百能做对,但至少表现了文心一言的考虑历程”

在逻辑推理方面比较GPT-4,个人觉得文心一言处理的仍是有点小儿科了,拟人化方面暂时先对半分吧

多模态才能

为即将到来的2023国际智能交通大会创作海报,而且支撑文字转视频,文字转语音才能

比较GPT的强壮,文心一言差的不是一星半点

编程方面

有些遗憾的是,在ChatGPT被一再称誉的编程方面,文心一言并没有现场展现相关才能,只能认为现在不具备或者只具备很弱的才能,和GPT不能相提并论

算力方面

文心一言底层算力支撑,是位于李彦宏老家阳泉的百度阳泉智算中心,专门为自家大模型产品文心一言供给核算推理的算力需求,阳泉智算中心是亚洲单体最大的智算中心,算力规模可达4EFLOPS(每秒400亿亿次浮点核算)

但比较微软的大投入,上万张英伟达A100芯片,几十万张GPU仍是稍逊

运用生态

现在,文心一言在百度内部现已接入百度查找,小度和自动驾驶Apollo等产品,外部包含爱奇艺等650家公司也现已接入

生态方面也仅限国内比较仍是不足

文心一言背后原理

据王海峰(百度首席技能官(CTO),深度学习技能及运用国家工程研究中心主任)介绍,文心一言主要脱胎于两大模型,六项核心技能。

两大模型:

百度ERNIE系列常识增强千亿大模型,以及百度大规模开放域对话模型PLATO

六项核心技能:其间三个是广为人知的大模型技能,包含有监督精调、人类反应强化学习和提示构建。另外三个,则是“百度特征”的技能,

包含常识增强、检索增强和对话增强技能

总结

固然,文心一言和GPT-4还有很大差距。虽然网上很多人对文心一言打击的一文不值,批判的体无完肤,可是这也是我们对百度的希望太高。对比GPT-4的光芒万丈就显得自惭形秽了,但百度作为国内AI的头部企业实力仍是不容小觑的,在中文处理方面有着得天独厚的优势,而且在AI的很多运用场景也有着自己的奉献。

希望我们能理性看待百度的文心一言,虽然还有缺陷,但随着时间的消逝,我相信国产AI会有着归于自己的辉煌,让AI真实的服务给更多的人。

就像有句话说的,国际上不能只要一种声音,一枝独秀不是春,百家争鸣才是春。