随着AI的大火,最近AI圈可谓风云际会,各方大佬纷繁上台。在3月14日,GPT-4的发布会圆满结束,3月15日,百度的李彦宏也做了文心一言的发布会,没看过的小伙伴,能够在网上搜搜发布会的视频。
“文心一言”各种梗图
百度真“人工”智能
机敏的网友让GPT-4点评文心一言,演出实际版的同行相轻
发布会上李彦宏步履蹒跚,表情略显紧张,没有往日的自傲沉着。那么百度的文心一言和GPT比较究竟实力如何?是骡子是马,我们拉出来遛遛。
GPT-4 VS 文心一言
接下来主要从
多模态生成,数理逻辑核算,编程方面,拟人化,算力方面,中文了解,运用生态
等方面剖析下究竟谁强谁弱
GPT-4
OpenAI老板Sam Altman点评GPT-4是现在为止最强的AI,根据OpenAI官方的介绍,GPT-4是一个超大的多模态模型,它的输入能够是文字(上限2.5万字),还能够是图画
最令人惊奇的是只需要简单在纸上画一个网站的草稿图,拍一张照片上传给GPT-4,它就能够立马生成网站的HTML代码!(以后程序员真要赋闲了
)
OpenAI自称:在各种专业和学术基准上和人类相当!敢这么狂妄,背后仍是有东西的!
多模态才能
所谓多模态才能,即能够接受图画输入并了解图画内容,而且可接受的文字输入长度也增加到3.2万个字符(约2.4万单词)。比方模仿律师考试,GPT-4取得了前10%的好成绩,比较之下GPT-3.5是倒数10%,做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)
看图才能能够用来解说表情包、梗图
发问这张图哪里好笑?GPT-4能够按顺序描绘出每一格的内容,并总结出笑点:
用巨大的过时VGA接口给细巧的现代智能手机充电
数理逻辑核算
发GPT-4能够了解图表中数据的意义,并做进一步核算
编程方面
发布会直播上,OpenAI总裁现场表演了一波GPT-4给代码修Bug
出现问题啥也不用想,直接把2.4万字的程序文档一股脑扔给GPT-4就行。你只需要精通CV(复制粘贴)大法即可
而且能在几秒钟内瞬间得到解决办法
拟人化
GPT-4还开放了一个运用功能,答应修正“体系提示”,使其感觉更像真人一样!之前ChatGPT的答复总是冗长而平淡,这是因为体系提示中规则了“你只是一个语言模型……你的常识截止于2021年9月。现在经过修正“体系提示”,GPT-4就能够展现出更多样的性情,比方扮演苏格拉底
运用生态
必应早就用上了GPT-4,并得到了微软方面的证实
微软给OpenAI供给超算服务招引企业来运用Azure练习自己的大模型,同时直接在Azure中供给OpenAI模型服务(Azure OpenAI Service),此前包含GPT-3、Codex和DALLE 2等模型,都现已接入Azure
中文了解
GPT-4在中文了解方面的确略胜一筹。
文心一言
和GPT-4一样,文心一言是一个多模态大模型。李彦宏会上展现了文心一言具备的5种才能,包含
文学创作、商业案牍创作、数理逻辑核算、中文了解、多模态生成
文学创作
在文学创作上,李彦宏先来了一个最简单的发问,问《三体》作者是哪里人?先让文心一言介绍一下大刘,“毕竟我(文心一言)和刘慈欣是老乡嘛,都来自阳泉”
成果大错特错,直接把刘慈欣的老家破绽百出到了湖北省洪湖市
商业案牍创作
比方给新公司起个姓名,而且这个姓名它还有理有据,有迹可循
中文了解
发布会上,李彦宏向观众展现了文心一言对中文的了解才能,并自傲地说:文心一言对中国文化的了解,理应超出任何一个预练习大模型
为了证明这一点,李彦宏输入了一个问题:“洛阳纸贵。究竟有多贵?”,文心一言不只展现了历史渊源,还介绍了这个成语背后的经济学原理
我们再来问问GPT-4呢
在标准化的答复方面两者好像旗鼓相当
那么,难度再提高下,看看二者写藏头诗的才能
GPT-4没有真实了解“藏头诗”的意义
在中文了解上,属实是文心一言“小胜一筹”了。不过在英文上,李彦宏也承认,虽然文心一言也能处理,但才能是显著不如中文的。
数理逻辑核算
数学思维才能方面,文心一言处理的数学问题不算复杂,是小学常见的鸡兔同笼问题
有趣的是,李彦宏现场展现的第一题,引得文心一言说出了《狂飙》里高启盛的经典台词:这题出得不对。看起来更具拟人化
李彦宏表明,这些题“不敢说百分之一百能做对,但至少表现了文心一言的考虑历程”
在逻辑推理方面比较GPT-4,个人觉得文心一言处理的仍是有点小儿科了,拟人化方面暂时先对半分吧
多模态才能
为即将到来的2023国际智能交通大会创作海报,而且支撑文字转视频,文字转语音才能
比较GPT的强壮,文心一言差的不是一星半点
编程方面
有些遗憾的是,在ChatGPT被一再称誉的编程方面,文心一言并没有现场展现相关才能,只能认为现在不具备或者只具备很弱的才能,和GPT不能相提并论
算力方面
文心一言底层算力支撑,是位于李彦宏老家阳泉的百度阳泉智算中心,专门为自家大模型产品文心一言供给核算推理的算力需求,阳泉智算中心是亚洲单体最大的智算中心,算力规模可达4EFLOPS(每秒400亿亿次浮点核算)
但比较微软的大投入,上万张英伟达A100芯片,几十万张GPU仍是稍逊
运用生态
现在,文心一言在百度内部现已接入百度查找,小度和自动驾驶Apollo等产品,外部包含爱奇艺等650家公司也现已接入
生态方面也仅限国内比较仍是不足
文心一言背后原理
据王海峰(百度首席技能官(CTO),深度学习技能及运用国家工程研究中心主任)介绍,文心一言主要脱胎于两大模型,六项核心技能。
两大模型:
百度ERNIE系列常识增强千亿大模型,以及百度大规模开放域对话模型PLATO
六项核心技能:其间三个是广为人知的大模型技能,包含有监督精调、人类反应强化学习和提示构建。另外三个,则是“百度特征”的技能,
包含常识增强、检索增强和对话增强技能
总结
固然,文心一言和GPT-4还有很大差距。虽然网上很多人对文心一言打击的一文不值,批判的体无完肤,可是这也是我们对百度的希望太高。对比GPT-4的光芒万丈就显得自惭形秽了,但百度作为国内AI的头部企业实力仍是不容小觑的,在中文处理方面有着得天独厚的优势,而且在AI的很多运用场景也有着自己的奉献。
希望我们能理性看待百度的文心一言,虽然还有缺陷,但随着时间的消逝,我相信国产AI会有着归于自己的辉煌,让AI真实的服务给更多的人。
就像有句话说的,国际上不能只要一种声音,一枝独秀不是春,百家争鸣才是春。