欢迎关注微信大众号:FSA全栈行动

系列文章:

  • 《AI – stable-diffusion(AI 绘画)的搭建与运用》
  • 《AI – AI 绘画的精准控图(ControlNet)》

一、介绍

近日,AI 绘画(stable-diffusion)用来艺术化二维码算是比较炽热的事了,这个 idea 是由国人用 Checkpoint + LoRA + QR Code ControlNet 组合完成出来的,下面是几张图片事例:

AI - stable-diffusion 艺术化二维码

这是原作者的文章:《AI 生成可扫码图画 — 新 ControlNet 模型展示》

不过,文章内并没有讲述艺术化二维码的具体进程,也没有现成的 QR Code ControlNet 可供运用(或许出于某些原因没有公布吧,瞎猜的~),从网上收集了一些资料,运用现有的 ControlNet 模型也能够完成同样的作用,下面来看看具体完成进程。

二、实战

需求先下载 2 个 ControlNet 模型:

  • SD15_brightness:huggingface.co/ioclab/ioc-…
  • SD15_tile:huggingface.co/lllyasviel/…

下载后存放到 stable-diffusion-webui\extensions\sd-webui-controlnet\models 目录下。

注:主张将 ControlNet 插件升级到最新版别,支撑更多预处理器,还有更便利好用的 UI。

1、生成二维码

咱们先准备一张二维码图片,能够通过以下恣意一个网址生成:

  • 草料二维码:cli.im/
  • QR.io:qr.io/

2、灰度处理

  1. 上传二维码
  2. ControlNet Unit 0:打钩启用(Enable)
  3. 预处理器(Preprocessor):inpaint_global_harmonious
  4. 模型(Model):control_v1p_sd15_brightness
  5. 权重(Control Weight):0.4
  6. 开始与停止进程(Starting Control Step、Ending Control Step):01

注:假如你找不到 inpaint_global_harmonious 预处理器,把 ControlNet 插件升级到最新就有了。

AI - stable-diffusion 艺术化二维码

3、细节处理

  1. 上传二维码
  2. ControlNet Unit 1:打钩启用(Enable)
  3. 预处理器(Preprocessor):inpaint_global_harmonious
  4. 模型(Model):control_v11f1e_sd15_tile
  5. 权重(Control Weight):0.6
  6. 开始与停止进程(Starting Control Step、Ending Control Step):0.350.75

AI - stable-diffusion 艺术化二维码

注:假如你页面上没有多个 ControlNet 单元,能够到 Settings 中,找到 Multiple ControlNets 进行设置,详见:《AI – AI 绘画的精准控图(ControlNet)》

4、装备描述

依据你期望在二维码画面中呈现的东西进行装备,比如我期望在画面中呈现一个战火中的高达,我的参数装备如下:

  1. 正向提示词(Prompt):masterpiece, best quality, mecha, no humans, black armor, blue eyes, science fiction, fire, laser canon beam, war, conflict, destroyed city background
  2. 反向提示词(Negative prompt):UnrealisticDream, FastNegativeEmbedding
  3. 采样方法(Sampling method):Euler a
  4. 采样步数(Sampling steps):26
  5. CFG 比例(CFG Scale):6.5
  6. 随机种子(Seed):1234843297

注:假如你不知道这些装备含义是什么,能够查阅这篇文章:《AI – stable-diffusion(AI 绘画)的搭建与运用》

装备完描述后,点击 Generate 按钮,等待图片生成即可:

AI - stable-diffusion 艺术化二维码

至此,艺术化后的二维码就生成好了,而且是能够被正常扫码辨认出来的哦~

三、资料

在上述实战中,呈现了 1 个新的 ControlNet 预处理器和 2 个新的 ControlNet 模型,它们的作用别离是什么呢?

1、预处理器 inpaint_global_harmonious

inpaint_global_harmonious 首要用于部分(遮罩部分)重绘,在原生根据图生图的重绘形式上加入了 ControlNet 的操控,然后让 inpaint 能够愈加准确的预测重绘细节。可是注意,和普通部分重绘不同,ControlNet 的 inpaint 模型除了重绘遮罩部分外,遮罩以外的当地也会产生微小变化(重绘),这样做带来的优点是它能够更好地将重绘区域与全体画面交融,让全体出图愈加调和一致。当然你也能将 ControlNet 引导权重调理到最大,此时 ControlNet-inpaint 模型将尽或许得保持遮罩区域以外的画面不产生变化。

AI - stable-diffusion 艺术化二维码

上图是传统图生图的部分重绘,原图蒙版重绘部分往往会呈现与周围环境不相容的独立景物,无法一致全体布局。

AI - stable-diffusion 艺术化二维码

能够看到,对比传统图生图的部分重绘,ControlNet 的 inpaint 模型能在一致全体作用的前提下,补全蒙版部分的内容,一起遮罩外部分的概括和细节也得到了较好的保留。

上述介绍源自:www.jianshu.com/p/2e433f71f…

2、模型 control_v1p_sd15_brightness

该模型为稳定扩散带来亮度操控,答应用户对灰度图画上色或对生成的图画从头上色。

上述介绍源自: aigc.ioclab.com/sd-showcase…
huggingface.co/ioclab/cont…

3、模型 control_v11f1e_sd15_tile

tile 模型本来是为了扩大图片而规划的,具体来讲需求先将原图分割为一块一块的小区域(叫做 Tile 或瓦块),然后别离对每个瓦块进行图生图扩大,最终集合一切扩大后的瓦块,拼成完整的大图。之所以采用部分扩大后拼接的形式是为了削减显存占用。可是这样扩大图片也有坏处,那就是有必要要求每个小图在图生图时重绘起伏不能太大,由于本质上每个小图运用的也是全图提示词,当重回起伏过高时,老版别 tile 模型很或许会在每个小图里生满足图提示词所描绘的全部内容。

ControlNet1.1 版别后的 Tile 模型愈加强壮,它具有两种特性:

  • 疏忽图画中的细节并生成新的细节。
  • 假如部分瓦片语义和提示不匹配,则疏忽全局提示,并依据部分上下文引导扩散。

由于该模型能够生成新的细节并疏忽现有的图画细节,所以咱们能够运用该模型去除不良细节并增加细化的细节。例如,消除由图画大小调整引起的含糊。

上述介绍源自: www.jianshu.com/p/2e433f71f…
github.com/lllyasviel/…

四、剖析

我将实战中两个 ControlNet 单元依次生成的图片拆开,得到如下进程图:

AI - stable-diffusion 艺术化二维码

结合上述资料中对两个 ControlNet 模型的介绍,能够大致理解为 control_v1p_sd15_brightness 在二维码图片的基础上进行从头上色,但会丢失二维码信息,control_v11f1e_sd15_tile 则在此基础上,对二维码信息细节进行补充。至于预处理器 inpaint_global_harmonious,由于此场景下二维码并不需求进行 inpaint 处理,所以把预处理器设为 none 也是能够的,对成果并不影响。

假如文章对您有所协助, 请不惜点击关注一下我的微信大众号:FSA全栈行动, 这将是对我最大的鼓励. 大众号不只有Android技术, 还有iOS, Python等文章, 或许有你想要了解的技术知识点哦~

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。