修改:Aeneas

【新智元导读】面临画作总是词穷?现在,Midjourney 推出了一个新的图画工具,能够反向操作,只需输入图片,它就会给你输出提示。

Midjourney V5 上线后,网友们用它生成了数不清的惊叹作品。

在这个 AI 作画工具面前,人和人的距离,或许就体现在 prompt 上了。

去年在科罗拉多州博览会艺术竞赛上用 AI 打败了人类的获奖者,花了 80 多个小时,经过 900 次迭代后,才用 Midjourney 完成了《太空歌剧院》这一艺术创作。而 ta 直接回绝分享出自己的 prompt。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

是的,现在许多时候,一行完美又专业的 prompt,现已无价之宝。

而 Midjourney 仿佛深知我们的需求,最近,它上线了一个新功能——/describe,能够帮我们从图画中反推 prompt。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

从图画反推 prompt

现在,假如你有一个想模仿的图画,但你不知道要用什么样的 prompt 去描绘它,这时候,describe 就帮你大忙了。比方,下图是新海诚的《言叶之庭》(「言の葉の庭」)。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

拖进图画后,Midjourney 生成了下面四种 prompt。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

根据这四个 prompt,Midjourney 又生成了相似风格的四幅图。

几乎完美。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

而且,Midjourney 提供的描绘也能够激发出用户的更多灵感。传统的画家可能会患有空白画布综合征,AI 艺术家有时也会词穷,很难找到描绘照片的词语。

在 Midjourney 的 Discord 频道上,从「/describe」就能够启动文本描绘过程了。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

Midjourney 提供了一个拖放区,能够让你拖入图画。

然后按下回车键,就能够等候 prompt 了。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

四个文本提示,包含描绘性词语、款式详细信息和纵横比。宽高比在像素精确度方面与计算机相似,比方假如是一个 16:9 的图画,它会输出 504:283。

而四个文本提示生成后,你能够直接点击按钮,直接用它们生成图画,当然,在提交之前,你也能够挑选自己优化提示。

作家的意外收成?

更风趣的是,Midjourney 的这个新功能,竟然意外地让作家们获得了帮手。

假如找不到完美的形容词来描绘一幅画,只需要把图画上传到 Midjourney,文采斐然的语句就自动蹦出来了。

而 Midjourney 返回的文本提示,真是让人惊喜连连。其间包含「palewave」、「cranberrycore」和「icepunk」等流行语,以及各种艺术家、摄影师和作者的姓名。

而提示中出现人名时,甚至是可点击的链接,能够翻开谷歌查找,假如点击进去,你或许会获得更多的灵感来历。

比方,上传 Ross Burgener 的一张绝佳的作品,Midjourney 会这样描绘:”极光在 LED 照明的冰屋上跳舞,给雪的色彩带来了蓝色调”。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

它认出了北极光,会在提示中给出主张——可参阅艺术家 Qlexis Gritchenko 和摄影师 Nathan Wirth。它采用的词汇包含 「极地冰山」、「发光的天空」和「空灵的雕塑」。

网友们大喜,已玩疯

现在,网友们现已玩疯了。

有网友使用 describe 功能,生成了许多穿白色蕾丝裙的美人。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了
Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

有人输入了一堆珠宝的图画。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

得到了如下的 prompt。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

根据这些 prompt 生成的图画如下。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输入一个二次元萌妹。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输出的 prompt,出图效果很惊艳。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输入一只气质憨憨的大捻角羚的照片。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

生成的 prompt 如下。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输出的 prompt 生成的大捻角羚,气质更为冷峻。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输入一只海滩上的狗。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

Prompt 生出了四只埋在坑里的狗。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

输入穿戴燕尾服的动漫人物。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

生成如下 prompt。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

生成四张动漫人物。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

是 RLHF?

能够看到,Midjourney 最近的进步,能够用飞速形容。

英伟达 AI 科学家 Jim Fan 猜测,Midjourney 一直在根据人类反馈(「RLHF」)进行大规划的强化学习,而且,这可能是有史以来规划最大的文本到图画强化学习。

当用户挑选扩大图画时,是因为他们更喜爱它。假如不把这个过程当作奖赏信号,那真是巨大的浪费。这些数据搜集起来很便宜,而且完全符合用户群的需求。

拥有的用户越多,能够做的 RLHF 就越好,然后获得的用户就越多。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

他还给出了一个免责声明,表示这就是自己的一个脑洞,自己并不认识 Midjourney 的人。

但他们一定现已是这么做的,因为 UI 的格局看起来就像一个多项挑选题。

Midjourney学会看图说话!输入图像秒出prompt,网友玩疯了

最终,要注意的是,同图画生成相同,describe 功能需要使用积分,所以需要慎重地考虑。

而且现在,Midjourney 的免费功能,现已完全关闭了。

参阅资料:

the-decoder.com/midjourney-…

twitter.com/DrJimFan/st…