腾讯精准提示词控制神器-ELLA,让你出图更精准

AI教程 2024-07-26

ELLA(Efficient Large Language Model Adapter,高效大型语言模型适配器)由腾讯研究人员开发。该技术旨在提高文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过整合大型语言模型(LLM),ELLA极大增强了模型的文本对齐性能,而这一切无需对U-Net或LLM进行额外的训练。

简单的说,ELLA能让复杂的提示词可以生成更精准的图像,下面直接给出我做的几组对比图

先来看一下成果展示:

一个女孩,蓝色头发,粉色裙子,棕色眼睛,黄色的蝴蝶结,半身照,背景有个红色的砖房,还有黑色的栅栏

image.png

右侧很明显,把提示词里面的元素很好的体现出来了吧,这效果真的惊艳到我了。

这是一只体型硕大、纹理清晰的绿色鳄鱼,它舒适地躺在一片草地上,可爱的橙色针织毛衣包裹着它布满鳞片的身体。在它的脖子上,毛衣上有一个奇特的蓝黄条纹图案。背景中,一块光滑的灰色岩石遮住了小池塘的部分景色,水面上漂浮着荷叶。

image.png

安装介绍

插件安装

目前ELLA也有了ComfyUI的插件

插件官网:

https://github.com/TencentQQGYLab/ComfyUI-ELLA

节点管理器里面搜索 ELLA即可

image.png

安装完后记得重启服务

模型安装

模型下载地址:

https://huggingface.co/QQGYLab/ELLA/tree/main

image.png

下载圈中的这2个,分别放在放在 

ComfyUI/models/ella/ 和 ComfyUI/models/ella_encoder 下面即可

完整模型格式如下

image.png

流程使用

下面是完整流程

image.png

ELLA这里主要是来替代以前的CLIP文本编码器的,所有主要就下面这几个重要节点

ELLA文本编码

ELLA加载器

T5文本编码加载器

用法不难,按我下面这样串起来就行,可以组合成一个预设保持成模板,以后使用就很方便。

image.png

以上就是ELLA插件的使用了,很简单,但是效果很好,可以很精确还原我们复杂的提示词,也是一个提高出图质量的的提示词插件,纳入收藏吧。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章