AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 DallE 2、Stable Diffusion 等文生图模型,都归于 AIGC 的典型案例,它们经过借鉴现有的、人类发明的内容来快速完结内容创作。

“新晋流量”ChatGPT的背后,AIGC是“昙花一现”?还是将引领人工智能进入新的时代?「AIGC 周报」将从【技能前瞻】【企业动态】【方针法规】【专家观点】带你快速跟进 AIGC 国际。

01技能前瞻

ChatDoctor:哪里不舒服?

通用范畴中的大型言语模型(LLMs),如 ChatGPT,在遵循指令和发生相似人类的呼应方面取得了明显的成功。然而,此类言语模型并未针对医学范畴量身定制,导致答案精确性较差,无法为医学诊断、药物等供给合理的主张。

为了处理这个问题,该研讨收集了 700 多种疾病及相应症状所需要的医学测验和引荐的药物,从中发生了 5K 次医患对话。运用这些量身定制的医患对话对 LLMs进行微调,由此发生的模型具有巨大的潜力来了解患者的需求,供给明智的主张,并在各种医疗相关范畴供给有价值的协助。

Midjourney因“滥用”暂停免费试用;ChatDoctor:哪里不舒服?

论文链接:

arxiv.org/abs/2303.14…

BloombergGPT:金融界的大模型

从情感分析和命名实体识别到问答,NLP 在金融技能范畴的使用广泛而杂乱。LLMs已被证明对各种使命有效。

一项新研讨展现了 BloombergGPT,这是一个具有 500 亿参数的言语模型,它在广泛的金融数据进步行了练习。该研讨根据 Bloomberg 广泛的数据源构建了一个具有 3630 亿个令牌的数据集,这可能是迄今为止最大的特定范畴数据集,并增加了来自通用数据集的 3450 亿个令牌。

研讨在规范 LLM 基准、开放金融基准和一套能精确反映预期用处的内部基准上验证了 BloombergGPT。

成果标明,BloombergGPT在财经使命上明显优于现有模型,且不会献身通用 LLM 基准的功用。

论文链接:

arxiv.org/abs/2303.17…

HuggingGPT:连接大模型和机器学习社区

处理具有不同范畴和模式的杂乱 AI 使命是通向通用人工智能(AGI)的要害一步。尽管有丰厚的 AI 模型可用于不同的范畴和模式,但它们无法处理杂乱的 AI 使命。

考虑到 LLMs在言语了解、生成、交互和推理方面表现出特殊的才能,该研讨提出了 HuggingGPT——一个运用ChatGPT 等LLMs连接机器学习社区(如 HuggingFace)中的各种 AI 模型来完结使命的系统。

具体来说,在收到用户恳求时运用 ChatGPT 进行使命规划,根据 HuggingFace 中可用的功用描绘挑选 AI 模型,用挑选的 AI 模型履行每个子使命,并根据履行成果汇总呼应。

借助 ChatGPT 强壮的言语才能和 HuggingFace 丰厚的 AI 模型,HuggingGPT 能够完结众多不同模态和范畴的杂乱 AI 使命,在言语、视觉、语音等具有挑战性的使命中取得令人瞩目的成果,拓荒了一条加快迈向 AGI 的新道路。

Midjourney因“滥用”暂停免费试用;ChatDoctor:哪里不舒服?

论文链接:

arxiv.org/abs/2303.17…

自动音频描绘模型,视障者的福音

“在所有艺术中,对咱们来说最重要的是电影。”

——弗拉基米尔列宁

一项新的研讨开发了一种自动音频描绘(AD)模型,它能够摄取电影并以文本方式输出 AD。由于描绘对上下文的依赖性以及可用练习数据的数量有限,因此生成高质量的电影 AD 具有挑战性。经过运用预练习根底模型(如 GPT 和 CLIP),该研讨只练习一个映射网络来桥接两个模型以生成视觉条件文本。下图展现了电影 AD 根据泰坦尼克号出现的成果。

Midjourney因“滥用”暂停免费试用;ChatDoctor:哪里不舒服?

该研讨的首要贡献为:

(1)结合了电影编排的上下文、之前的编排广告以及字幕;

(2)经过在视觉或上下文信息不可用的大规模数据集进步行预练习来处理缺少练习数据的问题,如没有电影的纯文本广告或没有上下文的视觉字幕数据集;

(3)改善了当前可用的 AD 数据集,经曩昔除 MAD 数据集中的标签噪声,并添加字符命名信息;

(4)与从前的办法比较,这一模型在电影广告使命上获得了很好的成果。

参阅链接:

arxiv.org/abs/2303.16…

怎么从多视图输入中了解3D场景?

一项新的研讨提出了 ViewRefer,这是一个用于 3D 视觉根底的多视图结构,探究怎么从文本和 3D 模态中把握视图常识。关于文本分支,ViewRefer 运用 GPT 等 LLMs 的多样化言语常识,将单个根底文本扩展为多个几何一致的描绘。另一方面,在 3D 模态中,引入了具有交互视图注意力的 transformer 交融模块,以增强对象跨视图的交互。

更重要的是,ViewRefer 采用了一个视觉 transformer来有效地把握多模态数据中的视图常识,并从两个视点增强了这一结构:用于更强壮文本特征的视图引导注意模块,以及最终预测期间的视图引导评分战略。根据所规划的典范,ViewRefer 在三个基准测验中完成了很好的功用。

Midjourney因“滥用”暂停免费试用;ChatDoctor:哪里不舒服?

参阅链接:

arxiv.org/abs/2303.16…

ChatGPT真的鲁棒吗?

ChatGPT 在曩昔几个月里遭到越来越多的关注。尽管现已有许多研讨对 ChatGPT 的各个方面进行了评价,但公众仍不清楚其鲁棒性,即对意外输入的功用表现。鲁棒性是负责任的 AI 特别关注的问题,尤其是关于安全要害型使用程序。

该研讨从对抗性和 OOD 的视点对 ChatGPT 的鲁棒性进行了全面评价。经过挑选几个盛行的根底模型作为基线,成果标明,ChatGPT 在大多数对抗性和 OOD 分类和翻译使命上表现出一致性。然而,绝对功用远非完美,这标明对抗性和 OOD 鲁棒性仍然是对根底模型的重大要挟。

参阅链接:

arxiv.org/abs/2302.12…

02企业动态

Midjourney暂停免费试用

3 月 30 日,据外媒报导,当下最火的 AI 作画神器 Midjourney 已暂停免费试用。其公司创始人兼 CEO David Holz 在采访中标明,做出此举的首要原因是新用户的许多涌入。

David Holz 在本周二发布了这项决议,他在交际软件 Discord 上发布音讯时,说到了存在 “奇怪需求和试用乱用”。但在采访邮件中,Holz 则标明叫停免费服务 “是由于许多人为了逃避付费而注册一次性账户”。

但 Holz 之前从前说到 “乱用”,这让人们不禁置疑此次叫停也许与 Midjourney 近期生成的一系列病毒式传达图像有关,包含川普被捕和教皇身着时髦夹克的伪造图像,都被部分网民误以为是真实的存在。

参阅链接:

www.theverge.com/2023/3/30/2…

谷歌:在Gmail、Docs等产品中参加AI功用

谷歌将很快为用户供给在其 Workspace 产品中运用机器学习生成文本和图像的办法,这些功用包含在 Google Docs 中运用 AI 生成、总结和群策群力文本的新办法,根据用户的简略要点在 Gmail 中生成完整电子邮件的选项,以及生成图像、音频和视频来说明幻灯片中的演示文稿。一起,谷歌也供给了一个免责声明:“有时 AI 会犯错,有时它会用一些不同寻常的东西让你快乐,并且通常情况下,它需要指导。”

参阅链接:

www.theverge.com/2023/3/14/2…

360GPT首秀:回答有精确也有“翻车”

据科创板日报报导,3 月 29 日下午,在 “2023 数字安全与开展高峰论坛” 上,360 集团创始人周鸿祎现场演示了 360 大言语模型在 360 浏览器上的使用 “360AI”——在浏览器输入问题,其右侧会出现相应的问题及自动回复,这与 ChatGPT 在 Bing 浏览器中的作用相似。

在 360 AI 的回复中,会显示内容来源,这意味着用户能够对生成的信息进行溯源确认。关于一些问题,360 AI 能够予以精确回复,但一起,其生成答案的信息的可信度和精确性上还有不足。在业务开展方面,周鸿祎标明,将推出新一代智能搜索引擎和根据生成式 AI 大模型的 SaaS 化垂直使用。

03方针法规

OpenAI遭控诉**:暂停ChatGPT的商业部署**

上星期四,非营利安排人工智能与数字方针中心(CAIDP)向美国联邦交易委员会(FTC)投诉称,GPT-4 “有偏见性,欺骗性,对隐私和公共安全构成危险”。CAIDP 以为,OpenAI 违反了 FTC 对 AI 产品的指导,以及 FTC 法案第 5 条——禁止不公平和欺骗性的商业行为。

CAIDP 敦促 FTC 对 OpenAI 进行调查,并暂停其大型言语模型的商业部署,包含 ChatGPT 的最新版本。

该安排期望,在 OpenAI 部署其产品之前,FTC 能够树立一种独立评价 GPT 产品的办法,并期望 FTC 自动制定规则,为生成式 AI 产品制定规范。

参阅链接:

arstechnica.com/tech-policy…

意大利个人数据维护局:即日起禁用 ChatGPT

据路透社音讯,意大利个人数据维护局(Garante)于当地时刻 3 月 31 日宣告,即日起禁止运用聊天机器人 ChatGPT,并限制 OpenAl 处理意大运用户信息。

Garante 标明,OpenAl “必须在 20 天内经过其在欧洲的代表向他们通报公司履行这一要求而采纳的办法”,否则将被处以最高 2 千万欧元或公司全球年营业额 4% 的罚款。

做出这一限令的原因在于,Garante 以为 OpenAI 没有检查 ChatGPT 用户的年龄(这些用户应该在 13 岁或以上),并且没有就收集处理用户信息进行奉告,缺少许多收集和存储个人信息的法律依据。(点击检查详情)

参阅链接:

www.reuters.com/technology/…

04专家观点

科大讯飞集团总裁吴晓如:很快会发布大模型技能

在 3 月 31 日举办的沪港立异开展论坛上,科大讯飞集团总裁吴晓如标明,以 ChatGPT 为代表的技能标明机器在自然言语的处理才能上已完成质的腾跃,应该看到和 OpenAI 的差距并迎头追上。科大讯飞已储藏了一段时刻,很快会发布自己的大模型技能。

千人联名签署揭露信,呼吁暂停AI

上星期,包含马斯克在内的一千多名技能领袖和研讨人员敦促 AI 试验室暂停最先进系统的开发,并在一封揭露信中正告称,AI 工具 “对社会和人类构成深远危险”。揭露信中说,暂停将为 AI 系统引入 “同享安全协议” 供给时刻。“只要当咱们坚信它们的影响将是活跃的、且它们的危险将是可控的时分”,才应该推进强壮的 AI 系统的开发……如果这样的暂停不能敏捷实施,政府应该介入并暂停。”

这封信并非呼吁暂停所有 AI 开发,而是敦促各公司暂时中止练习比 GPT-4 更强壮的系统。不过,OpenAI 的管理人员称,他们还没有开始练习 GPT-5。OpenAI 首席履行官 Sam Altman 在接受采访时也标明,公司在进行开发作业时始终将安全作为要点,并在 GPT-4 发布前花了 6 个多月的时刻对其进行安全测验。

参阅链接:

www.nytimes.com/2023/03/29/…

反对千人联名,“潘多拉的魔盒”现已翻开

近来,千人联名要求 “暂停巨型 AI 试验”。然而,一些 AI 大神也发文揭露反对。

吴恩达:暂停研讨比 GPT-4 更强壮的 AI 模型是一个可怕的想法。GPT-4 在教育、医疗、食品等方面有许多新的使用,这将协助许多人。改善 GPT-4 将有所协助。咱们需要平衡人工智能正在发明的巨大价值与现实的危险。

田渊栋:我不签暂停令,AI 的开展就好像囚犯困境。一旦开始,就没有办法中止或扭转这一趋势,这便是进化的必然。应该换个视点持续向前看,更好地了解 LLMs,习惯它并运用其力量,感触热度。

Yi Tay:如果是把那些在网上胡乱讨论 LLMs 的人禁言 6 个月,我会签的。

Sam Altman:一个好的 AGI 应该具备三个特点,即对齐超级智能的技能才能、大多数领先 AGI 之间的充分协谐和一个有效的全球监管结构。

参阅链接:

twitter.com/2020science…

经济学家朱嘉明:AIGC将为元世界处理两个技能难题

近来,朱嘉明标明,元世界现在存在两个技能困难:一是元世界在处理大规模、非结构数据上的才能是单薄的,二是元世界从前的技能系统不能完结碳基人类向硅基人类转型,由于碳基人类是没有办法元世界化的。

现在,这两个问题靠 AIGC 能够处理。AIGC 能够处理不同形状的信息,如文本、图像、音乐、视频等,大大降低元世界技能系统的本钱,提高技能质量。一起,AICG 也将赋能许多数字人迁移到元世界之中,激活元世界生态。

参阅链接:

www.chinastarmarket.cn/detail/1308…

中信建投:AIGC与数字我国有望开启云核算产业链新一轮景气周期

中信建投研报指出,云核算作为数字经济和数字我国的柱石,有望依托方针支撑,迎来行业景气度的新一轮提高,一起以 ChatGPT 为代表的 AI 使用开展前景宽广,AI 大模型在练习和推理过程中均需要海量算力支撑,有望作为驱动新一轮云核算根底设施景气周期开启的重要引爆点,主张加大布局云根底设施产业链。

参阅链接:

www.chinastarmarket.cn/detail/1308…