未来十年需求最高的作业,是「AI 工程师」?

ChatGPT 呈现后,人们猜测「所有行业都要经过 AI 进行重塑」,有些作业会被替代,也有作业会改动形式。作为把 AI 造出来的程序员,他们的作业会变成什么样?
最近,事情看起来有了谱,一群工程师和学者喊出了「AI 工程师」的概念,获得了众多响应:

不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

由于 GPT-4 等大言语模型展现出的通用化且强壮的才能,咱们的作业方法或许很快就会转变成和 AI 协同作业,跟上人工智能的步伐本身就是一项全职作业。
听说,这个「AI 工程师」处于全栈工程师和机器学习工程师之间,占有后端工程师的一部分,专心于大模型的构建。现在它还处于定义阶段,不过看咱们热烈评论的样子,距离落地应该不远了,究竟 ChatGPT 革命的速度就是这么快。
主意一出,AI 范畴大 v 们迅速有了点评。OpenAI 科学家、前特斯拉 AI 和自动驾驶主管 Andrej Karpathy 标明赞同。「大模型创立了一个全新的笼统和专业层,到目前为止,我把它称为『提示工程师』,但现在不止是提示的问题。」
另外他指出四个要点:

  • 过去的机器学习作业一般要从头开始练习算法,而结果一般性能有限。

  • 大模型练习与传统机器学习有很大不同,前者系统作业量很大,进而分裂出一种新人物,专心于在超级核算机上对 Transformer 进行大规划练习。

  • 从数字上看,AI 工程师的数量或许会比机器学习工程师 / 大模型工程师多得多。

  • 你无需接受任何练习就可以成功担任这一人物。

不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

马斯克看完以后也说了:
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

职位需求大,有重要意义且门槛低,看起来让人既振奋又焦虑。
在评论中,也有人提出了「认知工程师」、「AI 系统工程师」等称号作为候选,英伟达 AI 科学家 Jim Fan 以为这种新式的作业应该被称为「无梯度工程师」—— 从传统东西 1.0,到神经网络 2.0,再到无梯度架构的 3.0,咱们总算等来了 GPT 系列自我练习的 4.0 版别。
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

对此,威斯康星大学助理教授 Sebastian Raschka 标明,这仅适用于通用助理,关于大多数事务,你也不需求「通用」。
称号和定义给了许多,让咱们看看这个「AI 工程师」到底是什么样的职位?
在根底模型的打破性才能和开源大模型、API 的推动下,咱们正在见证运用人工智能十年一次的转变。
在 2013 年需求花费五年时刻和一个研讨团队才能完结的人工智能使命,现在只需求 API、文档和 2023 年一个闲暇的下午即可完结。
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

但是,细节决定胜败 —— 运用和产品化人工智能的挑战无穷无尽:

  • 模型上,有从最大的 GPT-4 和 Claude 模型,到开源的 Huggingface、LLaMA 和其他模型;

  • 东西上,从最流行的链接、检索和矢量搜索东西(如 LangChain、LlamaIndex 和 Pinecone)到新式的自主代理范畴(如 Auto-GPT 和 BabyAGI);

  • 技术上,每天新提交的论文、模型和技术的数量跟着兴趣和资金的添加而呈指数级增加,以至于了解这一切简直已是一项全职作业。

若认真严厉地对待此种状况,这应该被以为是一份全职作业。因而,软件工程将催生出一个新的子学科,专门研讨人工智能的运用并有效地运用新式的堆栈,就像「站点可靠性工程师」(SRE)、「开发运营工程师」、「数据工程师」和「剖析工程师」的呈现相同。
这个人物的全新(也是最不令人敬畏的)版别似乎是:人工智能工程师。
咱们知道,每家创业公司都有某种评论 AI 运用的 Slack 频道,很快这些渠道将从非正式集体转变为正式团队。目前,不计其数的软件工程师正致力于出产 AI API 和 OSS 模型,无论是在上班时刻仍是晚上和周末,在公司 Slacks 或独立 Discords 中,这一切都将专业化并会集在一个头衔上:AI 工程师。
这或许是未来十年需求最高的工程作业。
人工智能工程师将随处可见,从微软和谷歌等科技巨子,到 Figma、Vercel 和 Notion 这样领先的草创公司,独立开发者,如 Simon Willison、Pieter Levels 和 Riley Goodside。他们在 Anthropic 进行的工程实践,每年可以赚取 30 万美元,在 OpenAI 构建软件,每年能赚取 90 万美元。他们运用周末闲暇时刻在 AGI House 思考主意,并在 Reddit 的 /r/LocalLLaMA 专区上共享技巧。
他们的共同点是,简直可以在一夜之间就能把人工智能的前进转化为数百万人运用的实践产品。而在其间,你看不到一个博士学位的头衔。在交给人工智能产品时,你需求的是工程师,而不是研讨人员。
AI 工程师与 ML 工程师的大回转
在 Indeed 网站上的一组数据标明,机器学习工程师的职位数量是 AI 工程师职位数量的 10 倍,但相比较而言,AI 范畴的增加速率更快一些,有猜测以为这种比例将在五年内产生回转,即 AI 工程师将会是 ML 工程师的数倍。

不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程
*HN Who’s Hiring(其是 Hacker News 上的一个月度帖子,它供给了一个渠道,供雇主发布招聘信息) 不同类别的月度就业趋势
*
一直以来,关于 AI 和 ML 之间差异的争论无休无止,但又小心翼翼。咱们也很清楚,职位为一般的软件工程师彻底可以构建起 AI 软件。但是,最近咱们又在围绕另一个问题展开评论,即在 Hacker News 的一个热帖「怎么进入 AI 工程」引起了咱们的广泛兴趣,这则抢手帖子也说明晰市场上依然存在的根本约束原则,对每个职位的区分仍是很细的。
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程
Hacker News 上 2023 年 6 月一个帖子的截图:「怎么进入 AI 工程」的抢手投票答案。

直到现在,还有许多人以为 AI 工程是 ML 工程或数据工程的一种形式,所以当有人询问怎么进入某一范畴时,他们倾向于引荐相同的先决条件,如在上面的答复中,许多人引荐了吴恩达(Andrew Ng)的 Coursera 课程。但那些高效的 AI 工程师中没有一个人完结过吴恩达在 Coursera 上的课程,他们也不熟悉 PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。
在不久的将来,没有人会建议经过阅览 Transformer 的论文《Attention is All You Need》来开始学习 AI 工程,就像你不会经过阅览福特 T 型车的规划图纸来开始学习驾驶相同。当然,理解根本原理和技术的前史进展是有协助的,它可以帮你找到进步思路和功率的方法。但有时你也可以经过运用产品,以实践经历来了解它们的特性。
AI 工程师与 ML 工程师的回转不会在一夜之间产生,关于具有良好的数据科学和机器学习背景的人来说,Prompt 工程和 AI 工程或许会在很长一段时刻内不被看好。但是,跟着时刻的推移,需求和供应的经济规律将会占上风,人们对 AI 工程观念也会改观。
为什么 AI 工程师会鼓起?
在模型层面,现在许多根底模型是少样本学习器,具有很强的上下文学习以及零样本搬迁才能,模型展现出来的性能往往超越了练习模型的最初意图。换句话说,创立这些模型的人并不彻底知道模型的才能范围。而那些非 LLM(大言语模型)专家的人可以经过与模型更多地交互,并将其运用于研讨所轻视的范畴来发现和运用这些才能。
在人才层面,微软、谷歌、Meta 以及大型根底模型实验室现已垄断了稀缺的研讨人才,他们供给了「AI 研讨即服务」的 API。你或许无法雇佣这种研讨人员,但你可以租用他们的服务。现在全球大约有 5000 名 LLM 研讨人员、5000 万名软件工程师。这一供应约束决定了处于「中间」类别的 AI 工程师将会兴起,然后满足人才需求。
硬件层面,各大科技公司、组织等很多囤积 GPU,当然,OpenAI、微软是第一个这样做的,但 Stability AI 经过强调他们的 4000 个 GPU 集群开启了草创公司的 GPU 竞争战。

不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

此外,一些新的草创公司开始兴起,如 Inflection(13 亿美元)、Mistral(1.13 亿美元)、Reka(5800 万美元)、Poolside(2600 万美元)和 Contextual(2000 万美元)现已普遍开始筹措巨额种子轮融资,以具有自己的硬件设备。
美国科技行业的高管和投资者 Nat Friedman 甚至宣布了他们的 Andromeda 方案,该方案是一座价值 1 亿美元、具有 10 exaflop 核算才能的 GPU 集群,专门为其投资的草创公司供给支撑。在 API 范畴的另一侧,将会有更多的 AI 工程师可以运用模型,而不仅仅是练习模型。
功率方面,与其要求数据科学家、机器学习工程师在练习单个特定范畴模型并投入出产之前进行繁琐的数据收集作业,产品司理、软件工程师可以经过与 LLM 进行交互,构建和验证产品主意。
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

假定后者(数据、ML 工程师)的数量是前者(AI 工程师)的 100 到 1000 倍,而经过与 LLM 交互的作业方法会让你比传统的机器学习快 10 到 100 倍。因而,AI 工程师将可以以比以往便宜 10000 倍的方法验证 AI 产品。
软件层面,会呈现 Python 到 JavaScript 的改变。传统上,数据和 AI 范畴以 Python 为中心,而第一批 AI 工程东西(如 LangChain、LlamaIndex 和 Guardrails)也以 Python 为主。但是,JavaScript 开发者的数量至少应与 Python 开发者数量适当,因而现在的东西越来越多地向这个方向扩展,从 LangChain.js 和 Transformers.js 到 Vercel 的新 AI SDK。JavaScript 的市场总体规划的扩大和机会是令人瞩目的。
每当一个有着彻底不同的背景、运用彻底不同的言语、出产彻底不同的产品、运用彻底不同的东西的子集体呈现时,他们最终会分裂成自己的集体。
代码在软件 2.0 到软件 3.0 演进中的作用

6 年前,Andrej Karpathy 撰写了一篇非常有影响力的文章,描绘了软件 2.0,将准确建模逻辑的经典堆栈手写编程言语与近似逻辑的机器学习神经网络的新堆栈进行对比。文章标明软件可以解决更多问题,而这些问题是人类无法建模的。
本年,Karpathy 持续发表文章指出,最抢手的新编程言语是英语,由于生成式 AI 的提示可以理解为人类规划的代码,许多状况下是英语,并由 LLM 解说,最终填补了他的图表中的灰色区域。

不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程
注:软件 1.0(Software 1.0)的经典堆栈是用 Python、C++ 等言语编写的。软件 2.0 是用神经网络权重编写的,没有人参加这段代码的编写过程,由于权重有许多。
去年,Prompt Engineering 成为一个流行的论题,人们开始将 GPT-3 和 Stable Diffusion 运用于作业。人们讪笑 AI 创业公司为 OpenAI 包装器,并对 LLM 运用程序易受提示注入和反向提示工程的问题感到担忧。
但 2023 年很重要的一个主题是关于从头确立人类编写的代码的作用,从超越 2 亿美元的巨子 Langchain 到由英伟达支撑的 Voyager,显示出代码生成和重用的重要性。Prompt Engineering 既被过度炒作又具有持久性,但在软件 3.0 运用程序中从头呈现的软件 1.0 范式既是一个巨大的机会,也为很多的创业公司发明了新的空间:
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程

跟着人类工程师学会运用 AI,AI 越来越多地接手工程作业,未来,当咱们回头看时,分辨出两者之间的区别现已很困难了。
参阅内容: www.latent.space/p/ai-engine…