当下已进入如火如荼的全民AI年代,最近体会了下midjourney,运用它的以图生图功用生成出来一套三国人物画像,和我们共享下运用心得。

运用midjourney的准备工作

下载东西

  运用midjourney出产图片依靠的东西和流程,大致如下:

使用midjourney搞出一套三国人物画像!

  • [1] 下载Discord App
  • [2] 添加Midjourney Bot
  • [3] 发送交互指令
  • [4] 生成图片

使用midjourney搞出一套三国人物画像!

  midjourney.commidjourney的官网,能够跟随网站引导提示完结运用体会。较为推荐和常见的运用姿态是在discord.com下载discord app后添加midjourney bot来进行指令交互完结图片生成。

使用midjourney搞出一套三国人物画像!

交互流程

使用midjourney搞出一套三国人物画像!

  关于图片的生成首要是经过输入给midjourney一些prompt和参数来完结的。

  • prompt 能够分为文本和图片两种类型,能够一起存在施加干预
  • 参数 常用参数如--ar指定图片比例、--vmidjourney版别等

参阅midjourney参数

以图生图

指令

  以图生图的指令结构十分简略,如下:

/imagine [url] [prompt] [param]

url:上传到midjourney的图片url
prompt:影响midjourney的提示
param:midjouryney支撑的参数装备

出图流程

使用midjourney搞出一套三国人物画像!

  • [1] 上传图片:在本地挑选一张图片上传到midjourney,支撑jpgpng通用格局,而bmp等格局需要转化后方可上传
  • [2] 仿制图片地址:仿制图片地址以备发送交互指令后运用
  • [3] 发送交互指令
/imagine https://s.mj.run/wws8EMAvHdE
she is a woman,in ancient China,2 foot tall doll in pixar::2 
--ar 3:4 --v 5 --q 2 --s 750 
--no braid,barbarians,earrings,glasses,wrinkle,baldness
  • [4] 生成图片:依据出图体感做v1~v4u1~u4prompt调整直到生成最满意的图

初体会

  • 文字生图/以图生图的不同

使用midjourney搞出一套三国人物画像!

  在纯文字prompt的场景下,生成出来的图是一个简直全未知的结果,需要进行许多的prompt调整才可能到达要求,在我进行纯文字prompt测验的case中简直没有一张能够满意我的出图要求,这既有个人指令熟练度、覆盖度的原因,也有文字prompt相对局限性的问题,当下出现了许多prompt网站,许多近乎成品的图和对应prompt被共享出来,但是拿着共同的prompt不必定拿到共同的图,存在很大的随机性、不稳定。

  但是,以图生图的优点是能够经过一个已经存在的图画,让AI来识别,根据“模板”来进行二创,在我进行以图生图prompt的测验case中拿到满意出图作用。假如你的起点是经过已有图片做较为稳定性的出图,比方给自己的照片做卡通形象,以图生图是很好的一种实现形式。

  • 模型数据影响

  关于出图描绘体感上更契合欧美人群,而且亚裔人的描绘并不是很契合现实,猜测和练习数据有必定联系,假如prompt不进行细节描绘,描绘很难契合预期。

最佳实践

  总结一句话就是:喜爱的原型图 + 喜爱的风格 = 二创满意的图!

使用midjourney搞出一套三国人物画像!

  • 第一步: 在prompt共享网站找到自己喜爱的midjourney生成好的图片,如lexica.art/ ,大部分是支撑关键字检索的,能够检索自己期望的风格、物品等描绘。
  • 第二步: 检查它的prompt进行参阅,过于简短的prompt没有太大参阅价值,首要参阅哪些风格系描绘,如cartoon(卡通)、painting(绘画)等,这儿我想要给我找到的原型图卡通一点的形象,我抽取了prompt为2 foot tall doll in pixar (皮克斯的 2 英尺高娃娃)作为我的出图作用设定。
  • 第三步 对图片细节进行详尽描绘,详细能够参阅如下人物特征描绘。假如你关于细节要求不高,对出图作用比较佛系,能够简略描绘核心特征即可。比方我在二创三国人物时分,会给简略prompt提示,如:
//性别
a man,
//中国古代
in ancient China,
//皮克斯风格,这儿装备了权重::2,增强midjourney的感知
2 foot tall doll in pixar::2
//我需要3:4比例的图片
--ar 3:4

  假如需要更为详尽的人物特征描写,能够参阅下面这组prompt。值得一提的是,并不是事无巨细越全越好,而是要挑选重点进行描绘,以图生图的优点之一是已经有一个成型的图片模板,AI会识别它的特征,而我们二创只需要根据它进行“改版”做适当微调就能够。

使用midjourney搞出一套三国人物画像!

错误陷阱

  在运用过程中也遇到许多badcase,这儿共享下:

  • 颜色灵敏

  在一个测验case中发现,midjourney对颜色词汇十分灵敏,但是也简单发生混乱,比方:

//带赤色的帽子
wearing a red hat,
//穿绿色的衣服
wearing a green clothes,

  有时分会只识别到一种颜色,而且会把整个画面变得过于“颜色化”。

  • 配合权重设置

  权重设置能够参阅上面的参数列表运用,它相当于是prompt的手动调优,让AI“注重”你的挑选和倾向。比方,我在运用皮克斯这个风格的时分AI有时会”疏忽“我的prompt,因而我会设置它的权重,增强这个prompt的存在感。

//设置权重,增强存在感
2 foot tall doll in pixar::2
  • 画“手”很难

  AI对手的描绘并不是很好,许多时分可能是“4指怪”、“6指怪”,握住东西,摆开一张弓等等,都是比较难的动作,需要反复调优prompt或许“碰运气”。

  • 女人人物更简单

  从我自身测验case来看,女人人物的以图生图描写更贴近而且更简单接受一些,出图作用更契合预期,男性人物可能因为图画中搀杂了更多的人物外物品如刀、枪、弓等,原型图描写张力更杂乱有联系,偶然会出现匪夷所思的作用。

作用展示

  下面是一些没有做太多微调的粗制版,供我们参阅。

原型图 皮克斯风格
使用midjourney搞出一套三国人物画像!
使用midjourney搞出一套三国人物画像!
使用midjourney搞出一套三国人物画像!
使用midjourney搞出一套三国人物画像!
使用midjourney搞出一套三国人物画像!
使用midjourney搞出一套三国人物画像!
# 材料收拾
网站 描绘
discord.com/ 社群东西,相当于一个IM端能够在群内拉入midjourney bot进行交互
midjourney.com midjourney官网
atoolbox.net prompt网站
ai.dawnmark.cn prompt网站
lexica.art 能够依据关键字来检查midjourney已生成的著作,相当于经过已生成图来反查对应的prompt,假如喜爱相似风格和样式,能够参阅prompt被己所用
www.mubucm.com/doc/_2As4DS… B站一个还不错的prompt共享
jpg2.cn/ 免费的批量图片转化网站,midjourney只接纳jpg/png等格局,假如有bmp等格局能够尝试运用它来做转化
三国志14人物头像 链接: pan.baidu.com/s/1X5kBnAqR… 提取码: 2qex