谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化


新智元报导

修改:修改部

**【新智元导读】**新版 PaLM 2 超强进化,作业全家桶 Workspace 全面晋级,Bard 全面增强、一切人可用…… 可以看出,这届 I/O 大会,谷歌是真的憋出不少大招。

谷歌 I/O 2023 大会,仿佛又给谷歌的支撑者们打了一针强心剂。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

此前,由于微柔和 OpenAI 的优异体现,谷歌现已被唱衰了好久。

可是,究竟是做出了许多奠基性作业的 AI 老牌公司,谷歌这一轮的发力,让咱们精力一振——它仅仅慢了,并不是噶了。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

对打 GPT-4 的 PaLM 2 登台、Duet AI 整进谷歌作业全家桶 Workspace、Bard 超强进化向一切人敞开、谷歌查找参加 AI 快照、AI 新功用整合进 Android 14、AI 魔术修改器参加谷歌相册等等。

这届 I/O 大会,可谓目不暇接,精彩纷呈。

PALM 2 秀肌肉,手机也能跑

OpenAI 的 GPT-4,现已被全世界公以为最强壮的言语模型。

怎样对打 GPT-4?谷歌的答案,便是 PaLM 2。

恰在今日,谷歌一同发布了 PaLM 2 技能报告。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

论文地址:ai.google/static/docu…

显然,PaLM2 被寄予了厚望,以缩小谷歌和微软之间在 AI 方面的差距。

劈柴介绍说,由于广泛的逻辑和推理练习,PaLM 2 模型在逻辑和推理方面愈加强壮。听说,PaLM 2 在超过 100 多种言语的多言语文本进步行了练习。

依据基准测验,关于具有思想链 prompt 或自洽性的 MATH、GSM8K 和 MGSM 基准评价,PaLM 2 的部分成果超越了 GPT-4。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

据谷歌高档研讨主管 Slav Petrov 介绍,PaLM 2 在推理、编码和翻译上都体现更好,与 2022 年 4 月发布的第一代 PaLM 相比,PaLM 2 有了明显的改善。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

可以看到,PaLM 2 的推理才能,得到了明显的改善

修改代码 bug 后,用韩语评论。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

比方,PaLM 2 可以了解不同言语的成语。

比起 PaLM,在最新专业言语熟练度考试中的体现,PaLM 2 的日语水平到达了 A 级,而 PaLM 到达了 F 级。PaLM 2 的法语水平到达了 C1 级。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

德语「Ich verstehe nur Bahnhof」假如直译,便是「我只了解火车站」,但假如你问它,你是不是了解错误了?

它马上就会告诉你,没错,这个德语的意思是「你说的啥?我什么都听不懂」。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

再比方,和波斯谚语「Na borde ranj ganj moyassar nemishavad」(No Pain, No Gain)意思相近的中文谚语是什么?

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

在相关论文中,谷歌工程师声称 PaLM 2 的言语才能现已「足以教授这门言语」,原因是其练习数据中的非英语文本更为普遍。

PaLM 2 包含了 4 个不同参数的模型,包含壁虎(Gecko)、水獭(Otter)、野牛(Bison)和独角兽(Unicorn),并在特定领域的数据进步行了微调,为企业客户执行某些使命。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

这些微调就像给一个货车底盘,加上一个新的发动机或前保险杠,以在某些特定使命上更好地作业。

这样的优势显而易见,不必花费大量的时间和资源来创立,直接部署。

别的,PaLM2 有一个基于健康数据练习的版本 Med-PaLM 2,可以轻松通过美国医学执照考试,到达「专家」水平。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

一个基于网络安全数据练习的版本 Sec-PaLM 2,可以解说潜在恶意脚本的行为,检测到代码中的要挟。这两种模型都将通过谷歌云供给给特定客户。

现在,PaLM 2 现已应用在 25 种功用和产品中,包含作业全家桶、谈天机器人 Bard、查找等等。

值得称赞的是,PaLM 2 最轻量版本 Gecko 小到可以在手机上运转,每秒可以处理 20 个 token,大约每秒 16 或 17 个单词。

不过,谷歌没有提及具体用什么硬件来测验这个模型,仅仅说在「最新的手机上」运转。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

显然,这次谷歌在大言语模型的小型化上,取得了非常重要的进步。在云端运转这种 AI,往往是很昂贵的,假如能在本地运转,无疑有着许多明显优势,比方隐私维护。

英伟达科学家 Jim Fan 对此大加赞赏——

下一波 LLM 将是移动原生的。一个离线的、永远在线的 LLM 不只可以降低服务本钱,而且还为用户体验拓荒了全新的途径。例如,一个元应用程序可以从你的移动作业流程中学习,并为你完成主动化。在小屏幕上节约的生产力,将比在大屏幕上多得多。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

此前,谷歌一向被嘲在 AI 研讨上现已落后于微软,PaLM 2,无疑是谷歌的一次严重回击。

但 PaLM 2 相同也面临着一些争议,比方练习言语模型的数据是否合法?

谷歌仅仅说到练习语料库来自「网络文档、书籍、代码、数学和对话数据」,但并没有进一步的细节。

而大言语模型的错觉问题,相同无法防止。谷歌研讨副总裁 Zoubin Ghahramani 表明,PaLM 2 是对早期模型的改善,谷歌「投入了大量精力,不断改善根底性和归因指标」。

但他供认,在打击 AI 产生的虚假信息方面,咱们都还有很长的路要走。

除了 PALM 2,谷歌还宣告了正在练习的全新根底模型 Gemini。这是第一个多模态模型,相同包含了参数巨细不同的模型。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

除了介绍模型,谷歌还特别介绍了开发 AI 技能的社会责任感,包含两个判别 AI 生成内容的东西:

  • watermarking(嵌入水印)

  • metadata(嵌入元数据)

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

Duet AI:作业全家桶新晋级

此前,微软 Copilot 把 GPT-4 整进了全系作业产品,掀起了震动全世界的作业软件革新。

怎样破?谷歌这次祭出了 Duet AI,给谷歌作业全家桶 Workspace 来了一个全新晋级。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

其实呢,这也便是新瓶装旧酒,Duet AI 便是 Docs 和 Gmail 等软件中 AI 东西的新姓名。

谷歌希望,生成式 AI 能让 Gmail、Docs、Sheets 和 Slides 更有用,不过现在,大部分功用还在开发中。

Duet AI 会包含谷歌的各种作业软件,包含在文档和 Gmail 中的写作辅助、幻灯片的图片生成、Meet 的主动会议摘要等等。

在文档中,只要点「Help me write」,Duet AI 就能主动帮你生成招聘启事。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

好玩的是,你还可以规定恣意文风,比方让它乖僻的调调写出一个作业描绘。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

在 Google Slids 中,Duet AI 能直接从幻灯片中的文本生成图画。

简略描绘一下,合意的图片立马生成。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

想做一个遛狗事务的收费表?描绘一下,它就给你主动生成。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

而 I/O 大会上一个真正的新事儿是,写作辅助也会应用在移动端的 Gmail 上,这是对 Smart Compose 的晋级。

现在,假如想试用这些新东西,需求注册 Workspace Labs,参加替补名单。

好消息是,现在任何人都可以请求参加替补名单了,不过现在尚不清楚用户何时可以拜访。谷歌的说法是,将在未来几周内将服务扩展到「更多的用户和国家」。

现在唯一可靠的消息是,Gmail 的移动程序上会呈现「Help me write」AI 助手,此前微软也曾推出类似产品,将必应集成到 iOS 和 Android 的 SwiftKey 键盘中。

Bard 又双叒叕便强了

发布会上,谷歌还宣告了一个重磅消息。

那便是,Bard 未来也能像 ChatGPT 相同,接入网络,实时查找网页。

这次,Bard 上新了不少功用,比方支撑了两种新的言语——日语和韩语,用户现在可以更简洁地把生成的文本导出到谷歌文档和 Gmail,可视化查找,以及深色模式等等。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

不过,最令用户开心的,想必是谷歌决定撤销 Bard 的等候名单——将在 180 个国家或区域供给服务。

此外,和 Adobe 的 AI 图画生成功用,以及 Instacart 和 OpenTable 等第三方服务的功用整合也正在路上。

总的来看,这些上新是给老 Bard 注入的一针强心剂。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

现在,谷歌正在使 Bard 变得愈加可视化,让 Bard 可以剖析图画,而且能在查询成果中供给图画信息等等。

关于这一方面,谷歌在发布会上展示了一个事例。

假如用户问 Bard,美国的新奥尔良有哪些必看的景点,那么 Bard 就能图文并茂的答复这个问题。

就像用户在谷歌搜图中问相同的问题相同。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

你还可以,用 Bard 起草邮件,并一键导入 Gmail,还有文档中。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

而另一个更好玩儿的功用是用图画提示体系。该功用由 Google Lens 供给,它可以识别图片中的物体。

比方说,上传一张狗狗的相片,然后给一个 prompt「为这两只狗写编一个有趣的标题」。Google Lens 就可以识别狗狗的种类,然后 Bard 就能写下与这两只狗狗特征相关的内容。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

该功用现在或许还不太完善,虽然潜力无限。未来怎么取决于体系的整合程度。

虽然对 Bard 来讲,这是一个相当严重的更新,但和 OpenAI 的 ChatGPT,以及微软的 Bing 之间的差距仍然是肉眼可见的。

要知道,微软在 3 月就给 Bing 增加了由 OpenAI 的 DALL-E 体系支撑的 AI 图画生成功用。而 OpenAI 和微软一向在探究怎么将谈天机器人与更多种的网络服务相结合。

不只如此,OpenAI 早些时候还宣告了 ChatGPT 将和 OpenTable 预订餐厅,以及 Instacart 订货配送的功用相结合。

谷歌表明,这些功用自己之后也会有的。

代码才能 up

谷歌表明,晋级后的 Bard 将会非常拿手处理有关代码的问题,包含调试和解说 20 多种言语的代码。

因此,今日发布会上的一些晋级主要会集在这个方面上。

包含新的深色模式,改善的代码引证功用——不只能供给来历,还能解说代码片段,以及一个新的导出功用。

用户可以把代码发送到谷歌的 Colab 渠道,还能和另一个基于浏览器的 IDE——Replit 一同运用(从 Python 查询开端)。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

只要选中代码,就可以一键导出到 Colab 或许 Replit。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

还支撑 20 + 种编程言语。根本包含了码农们所需的一切编程需求。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

乃至还能直接问询 Bard 怎样用某一种言语完成某种功用。只要 prompt 到位,生成一串代码也便是几秒钟的事。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

写完以后,还能就着某一行代码进行解说,以及完善。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

如此看来,结合了 PaLM2 的 Bard 应该会在生成质量上有明显的提升。当然,具体体现怎么,还得再观察。

对战必应,谷歌 AI 查找已来

此前,整合进 GPT 的必应势不可当,真正要挟到了谷歌的查找商场。

为了与微软必应竞争,谷歌同在今日推出了由 PaLM 2 驱动的全新查找引擎。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

它可以供给问题答复的摘要,比方问「为什么酵母面包仍然如此受欢迎?」,谷歌查找就给出几段具体描绘酵母的味道、其益生元才能的优势等等。

别的,在生成内容旁,给出了 3 个链接,以证明摘要中的内容。这样以减少 AI 在生成内容上呈现「错觉」问题。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

当你查找蓝牙音箱,首先顶部有一个简略的摘要,具体说明了购买时应留意的事项:电池寿数、防水性、音质。

右边是三个购买指南的链接,下面是 6 个不错选择的购物链接,每个周围都有一个 AI 生成的摘要。

可以看到,这是谷歌查找成果页面的 new look。把 AI 生成内容放在最开端。

比起重新规划的微软必应,查找成果顶部的 AI 框对谷歌来说更像是,一个小小的更新。

值得留意的是,要是想要拜访这一功用,你必须选择 Search Generative Experience(SGE)这一新功用。

并非一切查找都会有 AI 生成的答案。只有当谷歌的算法以为它比标准答案更有用时,AI 内容才会呈现,而像健康、财政等敏感主题彻底不会有 AI 生成。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

谷歌表明,其改善后的查找引擎可以以对话方法跟踪原始查找查询的选项,无需重复现已供给的上下文或细节。

然而,谷歌查找也不是无所不能,也存在从未彻底解决过的问题——结构编列(orchestration of structure)。

由于大部分数据储存在互联网上,乃至谷歌内部,但将一切这些数据放在一同构成一个连接的答案真的很难。

现在,现已敞开替补名单仅限美国,谷歌表明,未来几个月将考虑更广泛地推出这一功用。

一键退款,智能 P 图,沉溺导航

一键生成退款邮件?

谷歌行。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

劈柴在发布会一开端就整了个小活。航班撤销了得退款?不会写请求退款的邮件?

gmail 会。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

只要在 prompt 栏里输入要求,gmail 分分钟生成了一篇有理有据有节的退款请求邮件。

别的,谷歌 Map 现在也有了沉溺式 view,你想去哪,怼脸的实景导航来了。

你还能趁便问问空气质量、气候、交通状况,都能即时演示。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

Magic Editor 是谷歌最新发布的相片处理功用,运用生成性 AI,可以让用户在没有专业东西的情况下对相片进行各种修改。

不会 p 图星人的福音来了?

发布会上,谷歌分享了几个应用了这项新功用的事例,不得不说,效果酷炸了。

比方下面这张,Magic Editor 一键把瀑布前的人像挪到了侧面,还把背景中别的游客 p 掉了。不只如此,原本多云的气候硬是给 p 蓝了。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

再比方下面这张,Magic Editor 一键将长凳上的小孩连着凳子一同移到了中心,主动补齐了多出来的椅子,还把原画中缺失的气球补齐了。

而且天也 p 蓝了。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

当然,这项功用还没到最完美的境地。就比方说,细心看看上面这张图片,凳子挪动了,可是底下的影子没动。

但总之,这项功用对相片本身的了解是革新性的。

当然,咱现在还不必太忧虑是不是有的图片被 Magic Editor 处理过。由于谷歌说了,下半年才会推出这项功用。

AI 笔记本 Project Tailwind

学生党福音来了。

不得不说,谷歌还真把学生们拿捏住了。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

Project Tailwind 从本质上讲,便是个笔记本,可是加了 AI 的才能。

一下子就不相同了。

用户可以像问导师或许学习搭子相同进行在 Tailwind 里进行检索。

虽然谷歌把这个功用其定位为学生服务的东西,可是关于日常需求处理大量文本的打工人来说,也是严重利好。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

谷歌产品办理高档总监表明,Tailwind 就像一个真正的笔记本相同,你在里面记东西,而这些内容便是 AI 学习的对象。

用户可以简洁地从谷歌云端硬盘中选择文件,有用创立了一个兼具个性化和私家特点的 AI 模型。

现在,该功用在大学校园内进行了广泛的测验。

在示例演示中,Tailwind 收集了一大堆学习笔记,然后,生成了包含主题词在内的许多内容,比方,用户可以为特定主题创立术语表。

Tailwind 不只仅能为学生服务,它对任何从不同来历获取信息的人都有协助。

隐藏在 Tailwind 背面的理念是,为什么咱们不能为每个用户定制不同的 AI 言语模型呢?

当然,这里存在两个问题。

一方面是本钱问题。练习言语模型所需的核算需求和微调本钱都很高,谁来担负这个本钱?另一方面则是信息安全性。

究竟,捏造信息这种事可一点都不稀罕,谁能保证个性化的笔记本不会呈现相同的问题呢。

不过,是骡子是马还得拉出来遛遛。用户现在可以注册 Project Tailwind 进行测验。该功用也是 AI Labs 方案的一部分。

安卓开发小助手

此外,谷歌 I/O 大会上还推出了专为 Android 开发的 AI 编码机器人 Studio Bot。

不只可以生成代码、修复 BUG,乃至可以答复关于安卓应用开发的相关问题。

同时支撑 Kotlin 和 Java 编程言语,并将直接嵌入到 Android Studio 开发东西的东西栏中。

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

参考资料:

io.google/2023/intl/z…

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化

谷歌一雪前耻!全新 PaLM 2 反超 GPT-4,办公全家桶炸裂升级,Bard 史诗进化