猜猜看！哪张甜甜圈图是真的？AI数字人商业实践「真经」；LangChain X Prem挑战赛；故事绘本生成与盈利平台

日报&周刊合集 | 出产力东西与职业运用大全 | 点赞重视谈论托付啦！

猜猜看！你觉得，哪张甜甜圈的图片是真的？

这是 Reddit网站 Midjourney 子区发起的一项趣味应战：总共6张图，其中5张是AI生成的，只要1张是摄影的，让神通广大的网友们判别下哪张是实在的。

现在帖子的投票数现已高达 4,700，谈论区留言将近 700，特别活泼！归纳谈论信息来看，大家更倾向于〖第4张〗，判别理由大概有这么几项：

整齐：第4张摆放天然错落，其他都太整齐了

糖霜：第4张甜甜圈上的糖霜细节更清晰，并且类型更丰富

光线：第4张是来自左上方的天然光线

细节：仔细看！第4张盒子底部有面包屑和糖霜 ⋙ @reddit

LangChain X Prem 应战赛！

LangChain 与 Prem 联合举办了一项线上应战赛，6月26日至7月10日期间，鼓舞开发者利用Prem在本地部署AI模型和服务，构建新一代的AI运用程序。

参赛团队不超过4个人，单人也可参与；竞赛结束后将评定出3个最佳运用，并奖赏一万美金。

了解提沟通程、提交要求、运用方法、官方文档、评定规范等信息，能够查看官方博客 ⋙ @langchain

字节跳动要造机器人，团队方案扩充到百人

7月3日，晚点 LatePost 独家消息，字节跳动也将入局机器人职业，团队已有约 50 人，方案年底扩充到上百人。现在团队的业务方向明确为两部分：

▢ 一是出产一些机器人，优先服务字节的电商履约需求，涉及仓储里的分拣、组货和打包，以及物流环节

▢ 二是重视前沿技能，探究把 AI 大模型才能用到机器人上

由此推测，字节要做的机器人，可能是具备移动才能的、能在电商仓里送货的分拣机器人，以及带有视觉感知才能、能自己打包货物的机械臂 ⋙ @晚点 LatePost

Midjourney 推出 pan 功用，上下左右，能够平移扩展图片场景

7月4日，Midjourney 宣布正在测验名为「panning (平移)」的新功用，能够按指定的上下左右方向，拓宽生成图片的外部场景。这也使得「outpainting (补全)」功用更加强大。

用户生成图片后，下方菜单栏会出现⬅➡⬆⬇四个按钮，点击某个箭头后，图片就会依照这个方向进行拓宽补全。不过此项功用当时还有一些约束，需求更多的后续开发完善 ⋙ Twitter @Midjourney

StoryBird 根据提示词生成故事绘本，还能售卖挣钱

StoryBird 是一个绘本制作渠道，只需求输入1000词以内的提示词，渠道就能够生成一本完好的、带有精美插图的故事书。书本还能上架网站和亚马逊进行售卖哦！

网站还贴心地给出了提示词指南和示例，帮助生成更满意的绘本故事和插图：storybird.ai/chatgpt-sto…

StoryBird 现已上线了 ChatGPT 插件「Stories」，假如有 GPT-4 权限，那么只需安装插件并输入提示词，就能够等候生成故事和插图。需求注意的是：

输入的提示词，越详细越好

插件生成插图的时刻要久一些，需求耐性等候

能够编辑文本并从头制作，并且供给了多种选项，比方下降阅览年龄要求、调整文字阅览水平、调整故事长度等 ⋙ StoryBird | Twitter @xiaohuggg

AI Agents 绝佳总述：OpenAI团队的 Agents 了解与开展规划

LLM Powered Autonomous Agents 是 @Lilian Weng 一篇广泛传播的博文，能够说是现在 AI Agent 范畴优质论文的体系总述。Lilian 现在是 OpenAI 的 Head of Safety Systems，之前还领导过 OpenAI 的 Applied AI 团队，她的文章绝对值得一看~

AI Agent 被认为是 OpenAI 发力的下一个方向。Lilian 将 Agents 界说为 LLM、Planning、Memory、Tools的调集，并在文章中对每个组建的实现途径进行了详尽阐明：

▢ LLM (大言语模型) 是中心大脑

▢ Planning (任务规划) 、Memory (记忆)、Tool use (东西运用) 等则是 Agents 体系实现的三个要害组件

以下是文章的中心目录，原文很长，能够结合感兴趣的要点进行阅览：

1. Agent System 是什么

2. Planning 任务规划

任务分解〖Task Decomposition〗

自我反思〖Self-Reflection〗

3. Memory 记忆

Memory 的类型

最大内积搜索〖MIPS〗

4. Tool Use 东西运用

MRKL 架构

让模型学习运用外部东西的 API

HuggingGPT

API-Bank

5. AI Agents 事例实践

科学研究范畴的运用

Generative Agents

AI Agent 的概念验证

6. LLM Agents 的约束

有限的上下文容量

长期规划和任务分解方面的应战

天然言语接口的可靠性应战 ⋙ @Lilian Weng | @海外独角兽(中文翻译版)

AI虚拟人(数字人)商业实践现状，与未来开展初探

这是 @向阳乔木 7月2日举办的「AI虚拟人(数字人)沟通会」的会议记录和要点提炼，也是到现在对数字人共享最立体和透彻的内容。感兴趣能够前往飞书查看直播视频和文本！

▢ AI数字人类型和运用场景

二维/三维虚拟人：用于游戏、IP品牌 (柳夜熙)、内容创作等

真人形象数字人：用于直播卖货、营销/投流广告视频录制 (Heygen)、言语学习 (CallAnnie) 等

▢ AI数字人的价值是什么

代替人说话，提高表达功率和营销功率：例如真人做不到24小时直播，但数字人能够

发明实在世界无法完结的对话或沟通：例如AI talk的试验探究，复活故去的亲人等

▢ AI数字人面临的问题

渠道约束：现在数字人水平参差不齐，渠道担心直播观感，有必定打压约束；比方抖音出台一些规范，而微信视频号容忍度更低，人工查看封号

技能约束：形象只是皮郛，智能水平缓未来想象空间，依赖大模型技能提高

需求约束：直播带货算个落地场景，但不刚，现在更多是体验新鲜感

伦理/法令约束：声音、影像版权等，比方换脸、数字永生等

▢ AI数字人直播盈利方法

直接卖数字人东西软件：「实时驱动」在直播时能改音频话术，真人接收，市道价格在一年4-6万往上 (规范零售价)；「非实时驱动」一个月600元，作用很差，类似放视频的伪直播，市场价格紊乱，靠开展署理割韭菜

供给数字人运营服务，按直播间成交额抽佣

▢ AI直播卖货适用品类和场景

适用于不需求强展示的产品 (如品牌食品饮料)，服装就搞不了(过品快，衣服建模成本高)

适用于虚拟产品，如门票、优惠券等

不适用于促销场景，这涉及主播话术、套路，调动直播间气氛才能等

电商直播分为达播跟店播，数字人直播跑下来作用最好的是店播，数据基本能坚持跟真人相同 (朋友公司数据)

▢ AI直播的壁垒和未来市场格局是什么

时刻拉长，技能上没壁垒：但现在看仍有技能门槛，单纯靠开源算法拼的东西，实时性、可用性不高，比方更实在的对口型，更低的呼应推迟等

不会一家独大：可能4-5家一线作用，大多二三线作用公司；因为它只是东西，迁移成本低

真实把客户服务好、能规模化扩张的公司更有价值：疯狂扩署理割韭菜，不考虑客户作用的公司，售后问题很麻烦

有资源、有业务的大渠道下场，可能会带来降维冲击：例如剪映立刻要做，假如不仅供给数字人，还供给货品供应链、数据复盘剖析等等，全环节打通会绑定商家，很难打

▢ 面对大厂竞赛怎么办

大厂做产品有很多部门利益牵扯，法务合规等问题，不敢用野路子，开发上线产品功率低

大厂人工成本高，不少方向和范畴都不会做，以及不少内部决议计划也不必定靠谱

在电商范畴，数字人不能也无法成为壁垒，跟数字人配套的运营服务才是，大厂一般不愿做重运营的事 ⋙ Twitter @向阳乔木 | 观看录播视频 (134min)

关于「构建 LLM App」你所需求知道的一切

这是一篇长文，十分详尽地讲解了怎么运用 LLM 构建运用程序，并解说了相关概念的意义，以及你所需求的所有代码段。当然，假如你只想看一个「快速运用LLM构建运用程序」的简短教程，能够直接跳转到最后一部分！

▢ 咱们为什么需求大言语模型 (LLM)

▢ 微调 VS 上下文注入

Fine-Tuning (微调)

In-context learning / Context Injection (情景学习 / 上下文注入)

▢ 什么是LangChain？

Models (模型)：各类模型的接口

Prompts (提示)：提示管理、提示优化、提示序列化

Indexes (索引)：：文档加载器、文本拆分器、矢量存储-支撑更快、更高效地拜访数据

Chains (链)：链超出了单个LLM调用，它们允许咱们设置调用序列

Agents (署理)：是运用LLM来选择要采纳哪些操作的实体

▢ 手把手教你运用 LLM 构建App

运用LangChain加载文档

将文档拆分为文本块

从文本块到嵌入

界说要运用的LLM

界说提示模板

创建矢量存储 ⋙ 来历

感谢贡献一手资讯、资料与运用体验的 ShowMeAI 社区同学们！

◉ 点击 日报&周刊合集，订阅论题 #ShowMeAI日报，一览AI范畴开展前沿，捉住最新开展机会！

◉ 点击 出产力东西与职业运用大全，一起在信息浪潮里扑腾起来吧！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

猜猜看！哪张甜甜圈图是真的？AI数字人商业实践「真经」；LangChain X Prem挑战赛；故事绘本生成与盈利平台 | ShowMeAI日报