Stable Diffusion的“地基”:基础模型的搭建
Stable Diffusion多元模型,作为AI深度学习领域的一颗璀璨明珠,以其独特的魅力和广泛的应用领域,正吸引着越来越多的目光。今天,让我们一同揭开Stable Diffusion的神秘面纱,深入探索这个多元模型世界的精彩之处,并为大家介绍Stable Diffusion的各类模型。
Stable Diffusion模型,一种基于深度学习的生成模型,它巧妙地模拟了扩散过程,将噪声逐步转化为清晰的图像。其核心思想在于利用一个噪声预测器来精准预测图像中的噪声分布,并根据这一分布逐步去除噪声,从而生成高质量的图像。这一过程的背后,离不开海量数据的支撑和深度学习技术的不断创新。
接下来,小编就给大家介绍一些常用的大模型!
【一】大模型/底模型-属于基础模型,也叫预调模型。
【简介】:首先介绍的是大模型,是SD能够绘图的基础模型。安装完SD软件后,必须搭配基础模型才能使用。不同的基础模型,其画风和擅长的领域会有侧重。
【二】Lora模型-属于微调模型
【简介】:如果把基础模型比作房子的地基,那么Lora模型就是在地基上建造的房子。它用于满足一种特定的风格或指定的人物特征属性。在数据相似度高的情况下,使用微调模型可以大大节省训练时间和资源,同时产出你所需的结果。
【获取方式】:要想获得不同的lora,可以是到网络上C站或国内的AI图站下载。下载后的lora文件直接放到Stable Diffusion安装目录的models的lora目录里。刷新后就可使用。
【使用方法】:点击lora调用按钮后,在tag栏就可以看到一个词条,然后再继续编辑描述语即可。
【训练模型】:训练lora的教程B站上有很多,很容易让大家看的迷糊,毕竟每个人都有不同的训练方法,同时每个人的理解和硬件属性也不同,使其操作方式更加多元化。有关这方面的个人心得,大家可以在留言区畅所欲言!小编后续也会继续跟大家分享和探讨。
【三】VAE美化模型
【简介】:VAE,全名Variational autoenconder,中文叫变分自编码器,其作用是:滤镜+微调。
【温馨提示】:有的大模型是会自带VAE的,如我们常用的Chilloutmix。如果再加VAE则可能画面效果会适得其反。
【四】Embeddings和Hypernetworks个性化模型
【简介】:Embeddings-也是属于微调模型,Hypernetworks目前已经不怎么使用了。Embeddings叫文本反转,通过仅使用的几张图像,就可以向模型教授新的概念。用于个性化图像生成。与lora模型一样,Embeddings也必须配合基础模型使用。
【五】DreamBooth模型
【简介】:DreamBooth,可用于训练预调模型使用。其使用是通过指定主题的图像进行演算,训练后可以让模型产生更精细和个性化的输出图像。
【六】LyCORIS模型
【简介】:此类模型可以归为Lora模型,也是属于微调模型的一种,该模型的文件大小在340M左右。与其他Lora模型不同的是,其训练方式与常见的lora不同,但效果会更好。
大家比较喜欢的“Miniature world style 微缩世界风格”就属于这类模型。
【获取方式】:若要使用此类微调模型,需要先安装一个locon插件,直接将压缩包解压后放到StableDiffusion目录的extensions目录里。
【下载地址】:对此类模型有兴趣的小伙伴们,可以复制下方链接到网页打开进行。
https://github.com/KohakuBlueleaf/a1111-sd-webui-locon
【使用方法】:使用时需注意,除了要将lora调入,还要在正向tag开头添加触发词。
例如,这个微缩世界风格的lyCORIS的调用,正向描述语如下:
mini\(ttp\),(8k,RAW photo, best quality, masterpiece:1.2),island,cinematic lighting,UHD,miniature, landscape, Crystal ball,on rock, [lora:miniatureWorldStyle_v10:0.8](lora:miniatureWorldStyle_v10:0.8)
Stable Diffusion模型在多个方面展现出了其强大的能力。首先,它能够根据输入的文本描述生成与之匹配的图像,实现了文生图的功能。这一功能在艺术创作、广告设计和虚拟现实等领域具有广泛的应用前景。其次,Stable Diffusion模型还能够进行图生图的操作,即根据一张已有的图像生成另一张具有相似风格或内容的图像。这种能力在图像处理、风格迁移和创意设计中发挥着重要作用。
除了基本的文生图和图生图功能外,Stable Diffusion还提供了多种应用模型,以满足不同领域的需求。例如,ControlNet模型可以精准控制AI图像的生成,使得生成的图像更符合用户的预期和需求。此外,还有多种图像风格化模型,如Artist艺术家风格、Checkpoint预训练大模型等,它们能够将输入的图像转化为特定风格的艺术作品,为艺术创作和设计提供了更多的可能性。
目前,Stable Diffusion模型的应用范围非常广泛。在艺术创作领域,艺术家们可以利用该模型生成独特的艺术作品,探索新的创作风格和表达方式。在广告设计领域,Stable Diffusion可以帮助设计师快速生成符合品牌风格和宣传需求的图像,提高设计效率和质量。在虚拟现实领域,该模型可以生成逼真的虚拟场景和角色,为用户提供沉浸式的体验。