**内容一览:**2022 年 AI 范畴开展不断提速,新技能效果纷纷落地,模型迭代加快升级。本文总结了 2022 年 AI 范畴各大公司的技能成就。

**关键词:**年终盘点 大厂 技能创新

2022 年在此起彼伏的咳嗽声中接近尾声,这一年,AIGC 成为人工智能范畴最大黑马,ScienceAI 有了更多实际落地的应用,这一年咱们阅历了各大厂商缩减预算、裁撤员工,也体验了逢凶化吉的技能狂欢……

今日,咱们将经过这篇文章,与各位同行共同回忆 2022 年那些人工智能范畴具有打破性含义的研发效果。

data2vec

语音、视觉及文本自监督学习的通用框架

**发布组织:**Meta AI

**发布时刻:**2022 年 1 月

项目地址:

github.com/facebookres…

data2vec 是一个**大一统的多模态自监督学习模型,**能够以较高的功能处理图画、文本、语音等使命。

12 月 16 日 data2vec 2.0 发布,与现有的计算机视觉自监督算法比较,相同精度下速度快了 16 倍。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

data2vec 2.0 原理简介

AlphaCode

竞赛等级代码生成 AI

**发布组织:**DeepMind

**发布时刻:**2022 年 2 月

项目地址:

github.com/deepmind/co…

**AlphaCode 凭借大型语言模型,根据问题的语言描绘构建代码。**在 Codeforces 挑战赛中,AlphaCode 击败了 46% 的参赛者。该研究不只登上了 Science 封面,还被该杂志评入年度十大科学打破。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

AlphaCode 概览

DallE 2

文本到图画的生成东西

**发布组织:**OpenAI

**发布时刻:**2022 年 4 月

**项目地址:**openai.com/dall-e-2/

**DallE 2 根据文本描绘,能够创立更加具有现实主义色彩的艺术图画。**与 OpenAI 2021 年发布的 DallE 比较,DallE 2 能够生成更实在、更准确的图画,且分辨率提高了 4 倍。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢
2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

An astronaut riding a horse in a photorealistic style
DallE 2 生成的图画示例

Gato

全能型智能体

**发布组织:**DeepMind

**发布时刻:**2022 年 5 月

项目地址:

www.deepmind.com/blog/a-gene…

**Gato 是一个全能型智能体,**能够玩雅达利游戏、对图画进行描绘、谈天以及根据上下文决议输出文本、关节扭力或其他 token。

这种通用模型解决一切使命类似人工智能,终究或超越特定于专门范畴的模型。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

ESM Fold

蛋白质结构猜测模型

**发布组织:**Meta AI

**发布时刻:**2022 年 7 月

项目地址:

github.com/facebookres…

**ESM Fold 是一个猜测蛋白质序列的模型,**能够直接进行高准确度、端对端、原子层级结构猜测。它仅运用单个输入序列,只需检查单个蛋白质序列,这极大加快了推理速度。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

用 ESM Fold 进行单序列结构猜测

Make-A-Video

根据文本生成视频的 AI 系统

**发布组织:**MetaAI

**发布时刻:**2022 年 9 月

**项目地址:**makeavideo.studio/

Make-A-Video 是一个文本-视频生成模型,它经过带有文字描绘的图画,来学习常用的描绘方法,一起运用无标签视频,了解和学习移动方法。

Make-A-Video 生成的视频风格多样,对文本复原度高,是生成短视频方面的 SOTA 模型。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

根据文本描绘生成视频的部分示例

AlphaTensor

改进矩阵乘法,提高计算速度

**发布组织:**DeepMind

**发布时刻:**2022 年 10 月

项目地址:

github.com/deepmind/al…

AlphaTensor 改进了现在最优的 4*4 矩阵乘法,并且进一步提高了其他 70 余种不同巨细矩阵乘法计算速度。该效果登上了 Nature 封面,被 Scinece 杂志评入年度十大科学打破。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

AlphaTensor 架构一览

Magic 3D

text-to-3D content 创立东西

**发布组织:**NVIDIA

**发布时刻:**2022 年 11 月

项目地址:

deepimagination.cc/Magic3D/

NVIDIA 入局 AIGC,**凭文字描绘就可生成 3D Mesh 模型。**它结合 image conditioning 技能以及根据文本提示的修改方法,供给了一个控制 3D 组成的新思路,使得创立高质量 3D Mesh 模型成为可能。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

Magic 3D 经过两个阶段创立 text-to-3D content

ChatGPT

超级对话模型

**发布组织:**OpenAI

**发布时刻:**2022 年 11 月

项目地址:

openai.com/blog/chatgp…

ChatGPT 的训练运用了 RLHF (Reinforcement Learning from Human Feedback),与 InstructGPT 运用的方法相同,仅在数据搜集设置上有细微差别。

ChatGPT 能够像人类一样谈天沟通,完结编撰邮件、视频脚本、文案、翻译及代码等使命。自上线以来,引起了海内外很多开发者的争相试用和热烈评论,可谓 2022 年开发人员参加度最高的技能项目。

ChatGPT 训练过程概览

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

PointE

根据文本描绘生成 3D 点云

**发布组织:**OpenAI

**发布时刻:**2022 年 12 月

项目地址:

github.com/openai/poin…

用 PointE 根据文本提示生成 3D 点云的过程分为三个步骤

1、根据文本提示,生成一个组成视图 (synthetic view)

2、根据组成视图,生成 coarse point cloud (1024 point)

3、根据低分辨率点云和组成视图,生成 fine point cloud (4096 Point)

使用 PointE 单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力耗费时代。

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

冬去春来,畅想 2023

2022 行将画上句点,2023 注定是充满不知道的一年,AIGC 范畴会有哪些新效果?ScienceAI 将怎么应对基础科学与 AI 穿插带来的挑战?芯片研发、国产操作系统,又会发生哪些新打破?

你对 2023 年人工智能范畴的技能和应用有哪些预判,欢迎留言沟通评论~

2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢