当下已进入如火如荼的全民AI年代,最近体会了下midjourney,运用它的以图生图功用生成出来一套三国人物画像,和我们共享下运用心得。
运用midjourney的准备工作
下载东西
运用midjourney出产图片依靠的东西和流程,大致如下:
- [1] 下载Discord App
- [2] 添加Midjourney Bot
- [3] 发送交互指令
- [4] 生成图片
midjourney.com
是midjourney
的官网,能够跟随网站引导提示完结运用体会。较为推荐和常见的运用姿态是在discord.com
下载discord app
后添加midjourney bot
来进行指令交互完结图片生成。
交互流程
关于图片的生成首要是经过输入给midjourney一些prompt和参数来完结的。
- prompt 能够分为文本和图片两种类型,能够一起存在施加干预
-
参数 常用参数如
--ar
指定图片比例、--v
midjourney版别等
参阅midjourney参数
以图生图
指令
以图生图的指令结构十分简略,如下:
/imagine [url] [prompt] [param]
url:上传到midjourney的图片url
prompt:影响midjourney的提示
param:midjouryney支撑的参数装备
出图流程
-
[1] 上传图片:在本地挑选一张图片上传到
midjourney
,支撑jpg
、png
等通用格局,而bmp
等格局需要转化后方可上传 - [2] 仿制图片地址:仿制图片地址以备发送交互指令后运用
- [3] 发送交互指令:
/imagine https://s.mj.run/wws8EMAvHdE
she is a woman,in ancient China,2 foot tall doll in pixar::2
--ar 3:4 --v 5 --q 2 --s 750
--no braid,barbarians,earrings,glasses,wrinkle,baldness
-
[4] 生成图片:依据出图体感做
v1~v4
、u1~u4
、prompt
调整直到生成最满意的图
初体会
- 文字生图/以图生图的不同
在纯文字prompt的场景下,生成出来的图是一个简直全未知的结果,需要进行许多的prompt调整才可能到达要求,在我进行纯文字prompt测验的case中简直没有一张能够满意我的出图要求,这既有个人指令熟练度、覆盖度的原因,也有文字prompt相对局限性的问题,当下出现了许多prompt网站,许多近乎成品的图和对应prompt被共享出来,但是拿着共同的prompt不必定拿到共同的图,存在很大的随机性、不稳定。
但是,以图生图的优点是能够经过一个已经存在的图画,让AI来识别,根据“模板”来进行二创,在我进行以图生图prompt的测验case中拿到满意出图作用。假如你的起点是经过已有图片做较为稳定性的出图,比方给自己的照片做卡通形象,以图生图是很好的一种实现形式。
- 模型数据影响
关于出图描绘体感上更契合欧美人群,而且亚裔人的描绘并不是很契合现实,猜测和练习数据有必定联系,假如prompt不进行细节描绘,描绘很难契合预期。
最佳实践
总结一句话就是:喜爱的原型图 + 喜爱的风格 = 二创满意的图!
- 第一步: 在prompt共享网站找到自己喜爱的midjourney生成好的图片,如lexica.art/ ,大部分是支撑关键字检索的,能够检索自己期望的风格、物品等描绘。
-
第二步: 检查它的prompt进行参阅,过于简短的prompt没有太大参阅价值,首要参阅哪些风格系描绘,如cartoon(卡通)、painting(绘画)等,这儿我想要给我找到的原型图卡通一点的形象,我抽取了prompt为
2 foot tall doll in pixar (皮克斯的 2 英尺高娃娃)
作为我的出图作用设定。 - 第三步 对图片细节进行详尽描绘,详细能够参阅如下人物特征描绘。假如你关于细节要求不高,对出图作用比较佛系,能够简略描绘核心特征即可。比方我在二创三国人物时分,会给简略prompt提示,如:
//性别
a man,
//中国古代
in ancient China,
//皮克斯风格,这儿装备了权重::2,增强midjourney的感知
2 foot tall doll in pixar::2
//我需要3:4比例的图片
--ar 3:4
假如需要更为详尽的人物特征描写,能够参阅下面这组prompt。值得一提的是,并不是事无巨细越全越好,而是要挑选重点进行描绘,以图生图的优点之一是已经有一个成型的图片模板,AI会识别它的特征,而我们二创只需要根据它进行“改版”做适当微调就能够。
错误陷阱
在运用过程中也遇到许多badcase,这儿共享下:
- 颜色灵敏
在一个测验case中发现,midjourney对颜色词汇十分灵敏,但是也简单发生混乱,比方:
//带赤色的帽子
wearing a red hat,
//穿绿色的衣服
wearing a green clothes,
有时分会只识别到一种颜色,而且会把整个画面变得过于“颜色化”。
- 配合权重设置
权重设置能够参阅上面的参数列表运用,它相当于是prompt的手动调优,让AI“注重”你的挑选和倾向。比方,我在运用皮克斯这个风格的时分AI有时会”疏忽“我的prompt,因而我会设置它的权重,增强这个prompt的存在感。
//设置权重,增强存在感
2 foot tall doll in pixar::2
- 画“手”很难
AI对手的描绘并不是很好,许多时分可能是“4指怪”、“6指怪”,握住东西,摆开一张弓等等,都是比较难的动作,需要反复调优prompt或许“碰运气”。
- 女人人物更简单
从我自身测验case来看,女人人物的以图生图描写更贴近而且更简单接受一些,出图作用更契合预期,男性人物可能因为图画中搀杂了更多的人物外物品如刀、枪、弓等,原型图描写张力更杂乱有联系,偶然会出现匪夷所思的作用。
作用展示
下面是一些没有做太多微调的粗制版,供我们参阅。
原型图 | 皮克斯风格 |
---|---|
# 材料收拾 |
网站 | 描绘 |
---|---|
discord.com/ | 社群东西,相当于一个IM端能够在群内拉入midjourney bot进行交互 |
midjourney.com | midjourney官网 |
atoolbox.net | prompt网站 |
ai.dawnmark.cn | prompt网站 |
lexica.art | 能够依据关键字来检查midjourney已生成的著作,相当于经过已生成图来反查对应的prompt,假如喜爱相似风格和样式,能够参阅prompt被己所用 |
www.mubucm.com/doc/_2As4DS… | B站一个还不错的prompt共享 |
jpg2.cn/ | 免费的批量图片转化网站,midjourney只接纳jpg/png等格局,假如有bmp等格局能够尝试运用它来做转化 |
三国志14人物头像 | 链接: pan.baidu.com/s/1X5kBnAqR… 提取码: 2qex |