被玩坏了!Midjourney“看图说话”,给张图就能反推Prompt

AI教程 2024-05-09

在各种 AIGC 产品层出不穷的今天,让 AI 画一张图已经不是什么难事。

尽管有着「无需动笔」、「零门槛作画」等一系列优点,但很多人并不能借助 AI 之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。

Prompt 方法是一门极深的管理学问:如果不输入精准的命令描述,生成结果就可能十分随机,甚至与预期相去甚远。但归根结底,如何给出完美的 prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在 prompt 上的成本,很少有人清楚。

而Midjourney 就学会了从图像中反推 prompt。如果你在 Midjourney 上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去生成自己想要的图片变体。

image.png

步骤

打开discord,进入可以使用Midjourney机器人的频道

在下方输入框中输入/,会自动跳出辅助选项,直接选择/describe即可(如果没有跳出,也可以在输入框中输入完整指令:/describe  然后回车激活

选择命令后,这时需要点击上传本地的参考图,然后回车发送命令

image.png

命令发出后,MJ服务器开始计算后返回结果,这个过程会等待一会,时间在半分钟左右

image.png

当计算完成,机器人会发送过来4个猜测的提示词方案,此时你就可以通过阅读理解参考图的画面元素了

image.png

Midjourney反推出的提示词都是基于它现有的神经网络的猜测,所以这其中就涉及到猜中概率问题。如果你的参考图有类似的图被大量训练,猜中的概率就会很高,提示词就更准确。反之Mjdjourney给出的提示词就可能只是擦边。

这是创建示例图像的原始 prompt:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors(一幅有树根的大脑图像,迷幻艺术,充满活力,作者 Alex Grey,作者 Amanda Sage,作者 Robert Venosa,霓虹颜色)

这是 Midjourney 描述的 prompt 之一,被用于混合:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts(一幅有树根的抽象大脑树图像,马克・亨森的风格,明亮的色彩,黑暗的象征主义,详细的解剖学,大胆的线条,鲜艳的色彩,心理现象的插图,千鸟格的木刻)

image.png

提示词验证

验证方法就是点击机器人发过来的消息下面与上面方案编号对应的1234,这个操作会发送一条 “文生图” 命令给Midjourney,然后等待Midjourney返回生成结果来判断提示词的准确性

image.png

提示词总结

通过结合返回的生成图和提示词对比,经过提取相近词和总结,再加入自己理解的关键词重新生成来判断提示词的准确性,发现图案元素过于复杂,这代表提示词不准确或者缺少关键提示词

重新反推

点击机器人发送的提示词这条消息的这个刷新按钮,可以让Midjourney重新反推提示词,然后再重复上面的步骤,不断调整提示词直到找到满意的作品。

更多参考图

有可能经过三四次的重复反推依然没有找到准确的提示词,这时就可以考虑反推更多相似的图片,从中找到共同点

引用参考图

通过更多的参考图找到了恰当的提示词,但是依然无法生成出上面这种效果?那么就可以将这些参考图的链接作为参考引用放入提示词输入命令中,再加上合适的提示词就能生成更精准的的相似作品。

作品展示

prompt

doll in cherry blossoms sitting on a rock, in the style of cartoonish character design, 32k uhd, artgerm, cute cartoonish designs, naoto hattori, detailed costumes

樱花中的玩偶坐在岩石上,卡通人物设计风格,32k uhd(uhd- Ultra high definition 超高清),artgerm(香港艺术家),可爱的卡通设计,naoto hattor(日本超现实主义艺术家),详细的服装

image.png

prompt

pink kimono girl, doll, pink cherry blossom, in the style of 32k uhd, cartoonish style, chinapunk, animal figurines, airbrush art, spectacular backdrops, tinycore

粉色和服女孩,娃娃,粉色樱花,32k uhd风格,卡通风格,中国朋克,动物雕像,喷枪艺术,壮观的背景,tinycore

image.png

prompt

a doll in vintage pink kimono sits on top of plants, in the style of 32k uhd, detailed character design, cherry blossoms, miki asai, jeremiah ketner, charming characters, neo-traditionalist

一个穿着复古粉色和服的玩偶坐在植物上,风格为32k uhd,详细的人物设计,樱花,唯美微距世界,jeremiah ketner(芝加哥艺术家:擅长表现女孩在充满鲜花、藤蔓和花园的宁静自然世界里嬉戏玩耍的插画场景),迷人的人物,新传统主义者

image.png

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章