Stable Diffusion的“地基”：基础模型的搭建

AI教程 2024-04-29

Stable Diffusion多元模型，作为AI深度学习领域的一颗璀璨明珠，以其独特的魅力和广泛的应用领域，正吸引着越来越多的目光。今天，让我们一同揭开Stable Diffusion的神秘面纱，深入探索这个多元模型世界的精彩之处，并为大家介绍Stable Diffusion的各类模型。

Stable Diffusion模型，一种基于深度学习的生成模型，它巧妙地模拟了扩散过程，将噪声逐步转化为清晰的图像。其核心思想在于利用一个噪声预测器来精准预测图像中的噪声分布，并根据这一分布逐步去除噪声，从而生成高质量的图像。这一过程的背后，离不开海量数据的支撑和深度学习技术的不断创新。

接下来，小编就给大家介绍一些常用的大模型！

【一】大模型/底模型-属于基础模型，也叫预调模型。

【简介】：首先介绍的是大模型，是SD能够绘图的基础模型。安装完SD软件后，必须搭配基础模型才能使用。不同的基础模型，其画风和擅长的领域会有侧重。

【二】Lora模型-属于微调模型

【简介】：如果把基础模型比作房子的地基，那么Lora模型就是在地基上建造的房子。它用于满足一种特定的风格或指定的人物特征属性。在数据相似度高的情况下，使用微调模型可以大大节省训练时间和资源，同时产出你所需的结果。

【获取方式】：要想获得不同的lora，可以是到网络上C站或国内的AI图站下载。下载后的lora文件直接放到Stable Diffusion安装目录的models的lora目录里。刷新后就可使用。

【使用方法】：点击lora调用按钮后，在tag栏就可以看到一个词条，然后再继续编辑描述语即可。

【训练模型】：训练lora的教程B站上有很多，很容易让大家看的迷糊，毕竟每个人都有不同的训练方法，同时每个人的理解和硬件属性也不同，使其操作方式更加多元化。有关这方面的个人心得，大家可以在留言区畅所欲言！小编后续也会继续跟大家分享和探讨。

【三】VAE美化模型

【简介】：VAE，全名Variational autoenconder，中文叫变分自编码器，其作用是：滤镜+微调。

【温馨提示】：有的大模型是会自带VAE的，如我们常用的Chilloutmix。如果再加VAE则可能画面效果会适得其反。

【四】Embeddings和Hypernetworks个性化模型

【简介】：Embeddings-也是属于微调模型，Hypernetworks目前已经不怎么使用了。Embeddings叫文本反转，通过仅使用的几张图像，就可以向模型教授新的概念。用于个性化图像生成。与lora模型一样，Embeddings也必须配合基础模型使用。

【五】DreamBooth模型

【简介】：DreamBooth，可用于训练预调模型使用。其使用是通过指定主题的图像进行演算，训练后可以让模型产生更精细和个性化的输出图像。

【六】LyCORIS模型

【简介】：此类模型可以归为Lora模型，也是属于微调模型的一种，该模型的文件大小在340M左右。与其他Lora模型不同的是，其训练方式与常见的lora不同，但效果会更好。

大家比较喜欢的“Miniature world style 微缩世界风格”就属于这类模型。

【获取方式】：若要使用此类微调模型，需要先安装一个locon插件，直接将压缩包解压后放到StableDiffusion目录的extensions目录里。

【下载地址】：对此类模型有兴趣的小伙伴们，可以复制下方链接到网页打开进行。

https://github.com/KohakuBlueleaf/a1111-sd-webui-locon

【使用方法】：使用时需注意，除了要将lora调入，还要在正向tag开头添加触发词。

例如，这个微缩世界风格的lyCORIS的调用，正向描述语如下：

mini\(ttp\),(8k,RAW photo, best quality, masterpiece:1.2),island,cinematic lighting,UHD,miniature, landscape, Crystal ball,on rock, [lora:miniatureWorldStyle_v10:0.8](lora:miniatureWorldStyle_v10:0.8)

Stable Diffusion模型在多个方面展现出了其强大的能力。首先，它能够根据输入的文本描述生成与之匹配的图像，实现了文生图的功能。这一功能在艺术创作、广告设计和虚拟现实等领域具有广泛的应用前景。其次，Stable Diffusion模型还能够进行图生图的操作，即根据一张已有的图像生成另一张具有相似风格或内容的图像。这种能力在图像处理、风格迁移和创意设计中发挥着重要作用。

除了基本的文生图和图生图功能外，Stable Diffusion还提供了多种应用模型，以满足不同领域的需求。例如，ControlNet模型可以精准控制AI图像的生成，使得生成的图像更符合用户的预期和需求。此外，还有多种图像风格化模型，如Artist艺术家风格、Checkpoint预训练大模型等，它们能够将输入的图像转化为特定风格的艺术作品，为艺术创作和设计提供了更多的可能性。

目前，Stable Diffusion模型的应用范围非常广泛。在艺术创作领域，艺术家们可以利用该模型生成独特的艺术作品，探索新的创作风格和表达方式。在广告设计领域，Stable Diffusion可以帮助设计师快速生成符合品牌风格和宣传需求的图像，提高设计效率和质量。在虚拟现实领域，该模型可以生成逼真的虚拟场景和角色，为用户提供沉浸式的体验。

Stable Diffusion