腾讯精准提示词控制神器-ELLA,让你出图更精准
ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。
简单的说,ELLA能让复杂的提示词可以生成更精准的图像,下面直接给出我做的几组对比图
先来看一下成果展示:
一个女孩,蓝色头发,粉色裙子,棕色眼睛,黄色的蝴蝶结,半身照,背景有个红色的砖房,还有黑色的栅栏
右侧很明显,把提示词里面的元素很好的体现出来了吧,这效果真的惊艳到我了。
这是一只体型硕大、纹理清晰的绿色鳄鱼,它舒适地躺在一片草地上,可爱的橙色针织毛衣包裹着它布满鳞片的身体。在它的脖子上,毛衣上有一个奇特的蓝黄条纹图案。背景中,一块光滑的灰色岩石遮住了小池塘的部分景色,水面上漂浮着荷叶。
安装介绍
插件安装
目前ELLA也有了ComfyUI的插件
插件官网:
https://github.com/TencentQQGYLab/ComfyUI-ELLA
节点管理器里面搜索 ELLA即可
安装完后记得重启服务
模型安装
模型下载地址:
https://huggingface.co/QQGYLab/ELLA/tree/main
下载圈中的这2个,分别放在放在
ComfyUI/models/ella/ 和 ComfyUI/models/ella_encoder 下面即可
完整模型格式如下
流程使用
下面是完整流程
ELLA这里主要是来替代以前的CLIP文本编码器的,所有主要就下面这几个重要节点
ELLA文本编码
ELLA加载器
T5文本编码加载器
用法不难,按我下面这样串起来就行,可以组合成一个预设保持成模板,以后使用就很方便。
以上就是ELLA插件的使用了,很简单,但是效果很好,可以很精确还原我们复杂的提示词,也是一个提高出图质量的的提示词插件,纳入收藏吧。