本文共享自华为云社区《AIGC:人工智能生成内容的崛起与未来展望》,作者:杜甫盖房子。

AIGC被以为是继专业生成内容(PGC)和用户生成内容(UGC)之后,使用人工智能技能主动生成内容的新式生产办法。跟着技能的开展,如Stable Diffusion和ChatGPT等领先技能的出现,AIGC逐步在文字、图画、音乐、视频、3D等多种形式内容的生产上发挥作用。然而,AIGC的快速开展一起也面临一系列应战,包含技能、安全、合规等方面。因而,咱们既要拥抱改变,也要直视应战,以期在不久的未来,AIGC能够在更多范畴大放异彩,敞开云核算工业链新一轮的景气周期。

开展进程

AIGC(Artificial Intelligence Generated Content),国内产学研各界对它的了解是“继专业生成内容(Professional Generated Content,PGC)和用户生成内容(User Generated Content,UGC)之后,使用人工智能技能主动生成内容的新式生产办法”。

来源:我国信息通信研究院和京东探索研究院

2022.09.23红杉美国发表了文章:《Generative AI: A Creative New World》,以为AIGC将带来新一轮的范式搬运。2022.11.30 ChatGPT发布,用户飞速增加,AIGC走进了大众视界中。无论是技能作业者、内容生产作业者还是营销推行作业者,都应该对AIGC有一定的了解。

AI的开展大致能够区分为三个阶段,咱们用一张图简略展现一下有关AICG的开展进程与典型事件:

探讨AIGC的崛起历程,浅析其背后技术发展

参阅:我国信息通信研究院

现在,AIGC正处于蓬勃开展的时期,大型企业加强出资布局,发布多范畴的预练习模型,如谷歌发布了BERT、Imagen等模型,Facebook发布了OPT-175B、M2M-100等模型,微软出资OpenAI,发布了GPT4、Codex等模型,百度也在大模型范畴深耕,发布了文心系列模型。此外,创业企业融资高涨,2022年10月,Stability AI获得约1亿美元融资,估值高达10亿美元,Jasper拿下1.25亿美元A轮融资,估值15亿美元。在使用侧,热点AIGC使用的用户数量呈指数级增加,例如ChatGPT用户破亿仅用了两个月。咱们以为,AIGC 技能正逐步渗透到人们的日子、作业场景中,AIGC技能开展与工业形态已开始构成,处于方兴未艾大有可为之时。

现状及使用

AIGC的开展依托于底层算力、算法的开展,从生成对立网络(Generative Adversarial Network,GAN)开始,AI生成高质量内容的才能快速提高,一些具有代表性的算法模型的开展进程如下:

探讨AIGC的崛起历程,浅析其背后技术发展

图源:《A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT》

依托于这些算法,不同使命范畴内出现了一批预练习模型与使用:

探讨AIGC的崛起历程,浅析其背后技术发展

从技能场景上看,AIGC逐步在文字、图画、音乐、视频、3D等多种形式内容的生产上发挥作用,在新闻稿、财报等结构化写作场景有较好的表现,在图画生成范畴能够在细粒度上遵从人类指导完结指定主题内容的发明,如Copilot等生产力东西也纷纷出现。

从更多的延展场景上看,AIGC能够有更广泛的使用,如合成数据,生成虚拟但与方针场景保持一致特点的虚拟数据,从而防止AI一向为人诟病的数据成见与隐私走漏问题;依据AIGC的虚拟陪同也会带来更多的社会价值,已经有一些企业将人工智能技能使用到精力健康的数字诊疗服务上,为临床患者和广大心思亚健康人群供给高质量、低成本、个性化、全天候的心情支撑、心思咨询和干预方案。

技能浅析

这一波火爆的AIGC技能中,Stable Diffusion 开源模型与 ChatGPT 分别引领了图画与文本生成范畴的热潮,AIGC也逐步从简略的降本增效(如结构化写作)向发明额定价值(如AI绘画)搬运,咱们将对这两个模型的开展与其中触及到的图画与文本相关技能进行简略介绍。

Stable Diffusion

AI绘画在曩昔的一年中一向是AIGC范畴的热点话题,跟着Stable Diffusion的开源,众多不同风格的模型纷纷出现。而高效参数微调办法LoRA与精密操控生成内容的ControlNet的发布,更进一步让AI绘画开展为工业可用的解决方案。

探讨AIGC的崛起历程,浅析其背后技术发展

Stable Diffusion从完成原理上,能够通俗的了解为这几步:

  1. 为了提高模型练习推理功率,捕捉高维信息,Stable Diffusion首先使用图画编码器,将图画从像素空间压缩到低维度的潜在空间;

  2. 使用如CLIP的文本编码器,将描述文本转换为文本向量;

  3. 在低维度的潜在空间中,依据一些条件(如文本向量)进行Diffusion过程;

  4. 使用图画解码器将潜在空间中的向量转换回像素空间来生成终究图画。

探讨AIGC的崛起历程,浅析其背后技术发展

图源:《The Illustrated Stable Diffusion》

咱们对Stable Diffusion中触及两个要害概念:CLIP与Diffusion进行简略解释:

  1. CLIP(Contrastive Language–Image Pre-training)是 OpenAI 在 2021 年提出的图文对练习的多模态模型,能够通俗的了解,CLIP能够判断图片和文本的相似度。预练习的CLIP模型具有树立文本潜在空间与图片潜在空间对应关系的才能,使用CLIP对文本进行编码能够完成文字描述操控图画生成的需求。

  2. Diffusion Model是 AI 绘画中非常常用的模型,在练习过程中,正向过程经过随时间逐步向图片中加噪的办法,让图片变成纯噪点图;逆向过程则是学习怎么将一张噪点图康复为高清图。在推理时,网络会随机初始化一个噪声向量,练习好的Diffusion Model在条件向量(如文本向量)的操控下逐步康复出图画向量,再经过图画解码器康复为像素图画。

ChatGPT

ChatGPT (GPT,Generative Pre-training Transformer) 是一个能够了解人类言语并做出相应反应的人工智能体系,在ChatGPT发布之前,GPT系列大模型已经经过几轮迭代。

探讨AIGC的崛起历程,浅析其背后技术发展

然而,之前的模型中存在一个典型的对齐问题,即大模型生成的呼应不一定符合用户目的。产生问题的原因是,从本质上讲,言语模型练习的方针是猜测下一个词,而不是按照用户目的来生成。为了解决这个问题,在ChatGPT的练习过程中引入了依据人类反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)办法,经过手动收集反馈数据 -> 练习奖励模型 -> 强化学习的练习流程提高了模型了解人类思想的准确性,能够经过一个简略的图示来展现这一练习过程:

探讨AIGC的崛起历程,浅析其背后技术发展

ChatGPT大都令人惊艳的行为,如呼应人类指令,使用思想链进行杂乱推理等都是RLHF的产品

参阅:How does GPT Obtain its Ability? Tracing Emergent Abilities of Language Models to their Sources

ChatGPT的成功,在技能上能够给咱们带来几点启示:

  1. 细致的数据工程是模型成功必不可少的作业;

  2. 监督微调和强化学习是矫正模型生成内容的要害技能。

AIGC与华为云

现在,AIGC的商场结构能够大略的区分如下:

探讨AIGC的崛起历程,浅析其背后技术发展

AIGC与云联系严密,AIGC使用依托于大模型的才能构建,而大模型的开发与运转都依赖云侧足够的算力。以ChatGPT为例,依据OpenAI陈述, ChatGPT是在InstructGPT 基础上微调而来,参数量约13亿,因而估计ChatGPT练习所需算力为27.5PFlop/s-day,假如用NVIDIA V100练习需要220天。可见,AIGC使用浪潮对算力的需求是前所未有的,这将迅速拉动云核算需求。闻名出资机构a16z在陈述中阐述,简直所有的AIGC相关使用都或多或少依赖云端的算力,因而a16z猜测AIGC商场的许多资金终究流向了基础设施公司,均匀来说,AIGC使用开发公司将大约20-40% 的收入用于模型推理与微调,而这部分一般直接支付给算力供给的云厂商。

算力作为AIGC的重要支撑,是影响AIGC开展的核心要素;除此之外,构筑在算力底座上的AI渠道,又能直接影响AIGC使用的开发和运转功率。华为云具有全栈全场景的AI才能,依据鲲鹏、昇腾的算力底座,供给了安稳高效的AI开发渠道ModelArts,从数据处理到模型练习、模型推理,能够大幅提高AI开发功率。

探讨AIGC的崛起历程,浅析其背后技术发展

此外,在ModelArts的资产社区AI Gallery中,也有许多AIGC相关的低门槛事例,如一键运转的AI作画事例,已有18,000+的累计运转:

探讨AIGC的崛起历程,浅析其背后技术发展

假如对AIGC感兴趣能够到AI Gallery体验相关事例。

应战及展望

跟着AIGC的快速开展,一些问题也逐步浮现。在技能上,现在言语模型是依据统计的,这一机制导致答复偏差的存在,进而导致虚伪信息传达的法律风险;数理范畴中的生成内容过错较多,无法使用到银行、医院等专业性强的范畴;模型仍不可解释与不可控,可能存在后门攻击、数据中毒、练习数据走漏等问题。在安全合规上,AIGC模型在练习过程中的数据使用合规问题、生成内容的知识产权问题,乃至是练习推理过程中带来的碳排放问题等,仍然存在许多应战。

身处人工智能的下一个时代,咱们不仅要拥抱改变,也要直视应战。在技能方面,怎么了解大模型的根本作业机制对模型安全与继续开展至关重要;除此之外,大模型练习与迁移流程优化是AI走向通用人工智能的要害。在技能开展的一起,AIGC的合规与管理应该引起重视。相信在不久的未来,AIGC将在更多范畴大放异彩,也将敞开云核算工业链新一轮的景气周期。

点击关注,第一时间了解华为云新鲜技能~