从学习到创造

AI 技能的里程碑

AI 开展阅历多个里程碑，最早能够追溯到 1950 时代，前期人们开端探索 AI 即人工智能的概念，后来就开发了一些前期的处理言语，比方 ELIZA；

到了 1960 时代，开展出了【专家系统】和【概括学习算法】；

再到 2000 年后，AI 开展出了【深度学习技能】、【自然言语处理技能】和【核算机视觉技能】这些关键技能；

再到 2022 年，ChatGPT 诞生，推翻 AI 从阅读理解到生成创造，自此，AI 能很好地合成成果、创造成果了~

一图胜千言，按照上图时刻顺序，接下来具体讲讲下各关键节点、关键技能。

来源

人工智能这个概念其实来源于：达特矛斯会议。

1956 年 8 月，约翰麦卡锡等人召集同道合的人一起评论，在会议中集思广益，持续了一个月，这催生了人工智能革新。

会议设定了 7 个议题，分别为：

主动核算机、怎么对核算机进行编程以运用言语、神经网络、核算规模理论、自我改善、抽象、随机性与创造性

操控论

操控论定义为“以机器中的操控与调理原理、以及将其类比到生物体或社会组织体后的操控原理为方针的科学研讨。”

意思是从这个时分开端，人们有了认识：用科学的方法去研讨对机器的操控。

操控论包括操控器规划、系统建模、智能操控算法、系统辨认和自适应操控等模块；

在我国，它被认为是现代资讯技能的理论根底，和系统论、信息论并称为“老三论”；

作为根底理论，操控论使用在许多范畴，比方工业操控、机器人技能、交通操控和能源管理等。

NLP

NLP 这个大家应该不陌生了，最近各种 GPT 发布会中一向有听到；

NLP，即自然言语处理（Natural Language Processing）

它旨在研讨怎么让核算机理解、处理和生成自然言语；经过 NLP 技能，人们能够开宣布各种言语使用程序，如语音辨认、机器翻译、文本分类、情感剖析等；

举一个 NLP 的比如：

咱们把香蕉给猴子，由于（它们）饿了

咱们把香蕉给猴子，由于（它们）熟透了

这两句话有着有相同的结构。可是代词“它们”却意思不同，这就考验机器的自然言语理解与处理；

中文博学多才，对于中文理解来说，更是如此：

《阿呆给长官送红包》长官：“你这是什么意思？” 阿呆：“没什么意思，意思意思。” 长官：“你这就不够意思了。” 阿呆：“小意思，小意思。” 长官：“你这人真有意思。” 阿呆：“其实也没有其他意思。” 长官：“那我就不好意思了。” 阿呆：“是我不好意思。”

ORZ，文心一言的中文处理才干任重道远~

CV

这里 CV 不是“复制粘贴”，而是 Computer Vision，核算机视觉。

NLP 是理解文字、CV 就是看图片。

CV 包括如下一些分支：画面重建，事件监测，方针盯梢，方针辨认，机器学习，索引创立，图画恢复等。它在 20 世纪末被推出；

根据 CV 技能，人们能够开宣布如人脸辨认、物体检测、图画切割、视频盯梢等各类使用；

_{NASA火星勘探车的双摄影机系统}

深度学习

深度学习，也是 AI 中最陈词滥调的概念。

官方来说：它是一种以人工神经网络为架构，对资料进行表征学习的算法；

非官方来说：它就是一种愈加强大、能处理更多复杂问题的机器学习方法；

由于它 运用多层神经网络模拟人脑的运作方法，从而能够主动从数据中学习特征并进行分类、预测和决议方案等任务；

数据量越大、核算才干越强，深度学习就越强。

_{经典的卷积神经网络模型}

GAN

GAN 是生成对立网络（Generative Adversarial Networks）的缩写，它是一种运用深度学习技能生成新数据的方法。

为什么叫对立？

由于它经过两个神经网络相互博弈的方法进行学习；

GAN 由一个生成器和一个判别器组成：生成器将随机噪声转换为新的数据样本，而判别器则测验区分生成器生成的样本和实在的数据样本。

经过重复练习生成器和判别器，GAN能够生成高质量的样本，例如图画、音乐和文本等。

GAN 在 2014 年被提出，它是从“深度学习”到“生成数据”的关键。

_{由 GAN 生成的人脸}

AI4S

AI4S 在 2022 年被提出，即 AI for Science：用人工智能先处理科学问题（学习科学原理），再处理产业问题。

由于现在，许多研制密集型产业（例如新能源、生物制药、原研材料和集成电路等）现现已过几十年的开展，进入了研制深水区，产业晋级面临的主要瓶颈越来越集中于根底科学问题的约束。

AI4S 能够用机器学习底层的科学原理，并将其使用于实际问题中，在许多场景中展现出极强的生命力。

用 AI 来做科研，再从科研到出产~

ChatGPT

时刻来到了 2022 年年底的 ChatGPT，AIGC 再次给世人以梦想。

ChatGPT 是 OpenAI 公司发布根据GPT的言语模型。该模型运用了很多的语料库进行练习，能够生成高质量的文本，例如文章、小说、新闻报道等。

为什么会是“高质量”？

GPT 模型根据 Transformer 架构，先在大规模语料上进行无监督预练习、再在小得多的有监督数据集上为具体任务进行精细调理（fine-tune）的方法。（这个，后面会再进一步讲解~）

More?

AI 开展如登山，各个队伍虽然路线不同，可是最终能高峰相见，现在的这个高峰就是 GPT 热潮，其代表就是 ChatGPT!

未来呢？还有更多吗？

其实，从学习到创造的进程，就像一个人，行万里路、读万卷书，见的多了，就会想着自己去总结、思考、创造、输出，这个进程相同也适用于 AI 身上。

下面聊聊 ChatGPT 的背后~

ChatGPT 技能树

这个国际上没有什么东西是凭空产生的，孙悟空都是从石头里蹦出来的，所以 ChatGPT 也一定是根据某个东西开展而来，这个东西就是：davinci

davinci

davinci 是 GPT-3 在 OpenAI 的内部代号，ChatGPT 根据 davinci 的内部多分支演进~

根据根底模型的成系统分支演进、交叉兼并促成了划时代的蜕变，一图胜千言：

ChatGPT 编年史

2020 年 7 月，OpenAI 发布代号为 davinci 的初代 GPT-3模型。
2021 年 7 月，OpenAI发布 Codex（代号code-cushman-001） 120 亿参数的 GPT-3 变体（代号code- davinci -001）微调得到。
2022 年 3 月，OpenAI 发布指令微调 (instruction tuning) 的论文，其监督微调 (supervised instruction tuning) 的部分对应了davinci-instruct-beta 和 text-davinci-001。
2022 年4月，OpenAI 完结在代码、文本上数据集上双重练习后发布GPT-3.5模型（代号code- davinci -002），敞开新的代际。
2022 年 6 月，OpenAI发布Instruct-GPT论文，论文模型（代号text-davinci-002）是根据code-davinci-002的有监督指令微调模型。
2022 年 11 月，OpenAI 发布根据text-davinci-002进行优化调教后的ChatGPT

ChatGPT 怎么迭代

人工标示

为什么 ChatGPT 对话 高质量？

根本原因是 它引进 RLHF 微调范式，指导模型对齐人类语境。

什么是 RLHF？

RLHF（Reinforcement Learning from Human Feedback）即运用强化学习的方法，运用人类反应信号直接优化言语模型。

简略来说，就是用人工去标示数据，对 AI 给出的问题选项进行判别答复，反应给 AI 以让它强化学习。

用专业的人去练习 GPT 的答案，给答复打分，就是 ChatGPT 背后最关键的练习方法~

其实，咱们运用 ChatGPT 时，也能经过点赞、点踩的方法进行反应，这相同能练习模型。

自监督学习+强化学习

以上所说的“自监督学习+强化学习”的大模型微调新范式，是未来 AI 模型范式开展的远景。

AI 先自己学，尽可能的学，学完后，AI 再答复一些范畴的规范问题，专业范畴的数据标示人员给 AI 答复打分，或者经过选项来选择更契合人性化的预期的答案，反应给 AI，AI 接着专业人员的反应继续学习、优化，再循环这个进程。

这就和咱们人类的学习方法是一致的，自学+教师指导，才干进步，否则只能是闭门造车、抱残守缺。

_{图片来源于内部资料}

ChatGPT 使用

现在，ChatGPT 能火爆很重要的原因在于它在各行各业都能被使用，其中最大的推翻是在 2 个方面：搜索引擎和内容创造。

ChatGPT 运用深度学习技能生成人类相似的对话，与搜索引擎相比，它能愈加智能地理解用户的意图，并且能够经过对话来供给愈加个性化的服务。

ChatGPT 能生成文本内容辅佐人工写作，乃至替代人工写作；

ChatGPT 还能辅佐编程，能够在本瓜之前的文章找到示例：/post/719743…

也有一些企业现已把 ChatGPT 接入到自己的使用中充任智能客服了，对比传统机器人客服，ChatGPT 能带来更好的对话体会。

。。。

ChatGPT 能成功是 AI 这座冰山显露水面的一角，其背后是“专业标示员”、“很多的练习”、“正反应”、“多层神经网络、”“超级核算机”、“算力”等等这些 AI 模块在加持；

最终咱们用 Susan Guthrie 的话做结：

“现在让国际惊叹的模型是构建于咱们几年前开端建造的超级核算机上的。”。

在未来，“新模型将构建于咱们现在正在练习的新超级核算机上，这台核算机要大得多，并且会愈加复杂。”

改变未来就在现在

OK，以上就是本次分享，希望各位工友喜欢~ 欢迎点赞、保藏、评论

我是安东尼 100 万人气前端技能博主 INFP 写作品格坚持 1000 日更文 ✍

重视我，安东尼陪你一起度过绵长编程年月

_{加我微信 ATAR53，拉你入群，定期抽奖、粉丝福利多多。只学习交友、不推文卖课~}

本文参考：

zh.wikipedia.org/wiki/
redian.news/wxnews/1832…
zhuanlan.zhihu.com/p/552166638
paddlepedia.readthedocs.io/en/latest/t…

本文正在参与人工智能创造者扶持方案

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

3 千字浅谈：AI 之巅，ChatGPT 之背后