runway Gen-3发布保姆级教程,深度解析文本提示词技巧
在AIGC的浩瀚领域中,文本引导词的艺术性被赋予了前所未有的重要性。随着Runway公司Gen-3 Alpha模型的震撼发布,一场关于如何精细驾驭生成式AI技术的革新风暴席卷而来。这不仅是科技进步的璀璨里程碑,更是激发无限创意与表达方式的全新篇章。
在探索Gen-3等前沿AI创作工具时,用户或许会遭遇一个普遍挑战:生成内容时常难以精准匹配心中的愿景。这背后的关键,往往在于引导词缺乏足够的细腻与精确。比如,“沙漠落日”这一表述虽美,却显得过于笼统,难以激发模型深层次的创意共鸣。
关于Gen-3的文本引导词构建策略,Runway智慧地提出了模块化思路,即将场景设定、主题构思及镜头动态等要素分门别类,清晰呈现,以达最佳效果。
文字生成类镜头
提示词:At night, fireworks burst in the sky, forming the words: 'Runway is the best.'
晚上,烟花在天空中绽放形成了文字:“Runway是最好的。”
将提示词中的“Runway是最好的”替换成“AI新榜”后的效果如下:
可见,Gen-3目前对中文的支持有限,但在英文文字输出方面已经相当成熟。虽然在测试过程中仍存在输出不稳定的情况,但在不超过三次“抽卡”的情况下,得到文字完整准确的视频已经足够令人惊喜。
长镜头生成
Gen-3支持生成长达10秒的多视角转换视频。
提示词:An extreme close-up shot of a desert lizard in a lush, grassy area. The camera pulls back, revealing the vast expanse of the desert.
极近距离拍摄一只沙漠蜥蜴在郁郁葱葱的草地上。摄像机拉远,展现出沙漠的辽阔景象。
在提示词中我们要求视频从大特写镜头过渡到全景镜头,最终生成的视频非常流畅且没有明显的画面瑕疵。AI生成的视频时长越长越容易“露怯”,Gen-3这轮表现相当惊艳。
人物类
一位白发戴眼镜的老先生正狼吞虎咽地吃着一个美味的奶酪汉堡。面包上撒满了芝麻,夹着新鲜的生菜、一片奶酪和一块金黄色的牛肉饼。当他咬下一口时,他的眼睛因享受而闭上。他穿着一件红色夹克,看起来像是坐在一家快餐店里。
Runway:
人物类镜头上,我们先用提示词“Will Smith Eating Spaghetti(威尔史密斯吃意大利面)”测试了一波Gen-3能否生成名人形象,得到了违反平台内容审核政策的消息提醒。
将提示词中的“Will Smith”替换成“一个男人正在吃意大利面”,才顺利生成了视频。
不过,以上两个Runway生成的人物类视频中,画面主体出现了“6指”或运动幅度过大导致的“歪脸”等常见的AI生成视频的技术瑕疵。
动物类
提示词:An orange cat is walking towards the camera.
一只橘猫正朝镜头走来。
这轮生成的视频在光影和视觉效果上相当吸睛,电影感拉满。但可惜的是,该条视频并未呈现出提示词所要求的主体运动。
考虑到可能是提示词不够详细,我们又写了多版提示词进行测试。测试结果显示,目前Gen-3仍存在和Sora一样的问题,无法理解电影拍摄术语,如“从景深处走向镜头”。
当然,由于篇幅原因我们没有测完所有电影术语。在处理“特写”“全景”等常见镜头表达方式时,Gen-3较少出错,但涉及到冷门的电影拍摄术语如希区柯克变焦(又称Dolly zoom),Gen-3就无法正确理解提示词的要求了。
提示词:A gigantic ginger cat walks along a quiet forest path,Dolly zoom.
一只巨大的橘猫沿着安静的森林小径行走,希区柯克变焦。
风景及超现实类镜头
提示词:Cherry blossoms fall gently from the tree, drifting slowly to the ground.The camera captures the movement of each petal, with a serene park or garden in the background, enhancing the scene's beauty and tranquility.
樱花轻柔地从树上飘落,缓缓地飘向地面。摄像机捕捉每片花瓣的移动,背景是宁静的公园或花园,增强了场景的美丽与宁静。
主流视频生成模型目前在风景类镜头生成上表现较为稳定。简单的日常风景难不倒这届AI,那超现实类的风景表现如何呢?
提示词:In the middle of the ocean, there is a tall, burning tree.
在海洋的中央,有一棵高大、燃烧着的树。
在本轮测试中,Gen-3生成的视频大致上符合我们对此超现实场景的想象。画面中的细节,例如树的高度和枝叶的繁茂程度,都可以通过进一步微调提示词来实现理想的画面效果。
动画类
提示词:In a 3D animation style, a little girl is casting a magical spell. The camera captures her movements as she waves her wand, creating sparkles and colorful light effects around her.
在3D动画风格中,一个小女孩正在施展魔法。镜头捕捉到她挥动魔杖的动作,周围闪烁着火花和五彩缤纷的光效。
最初我们喂给AI的提示词包含“皮克斯风格”,但与“威尔史密斯吃面”视频生成一样遭到了平台拒绝,之后改为“3D动画风格”才顺利生成视频。
整体视频生成效果上,5秒时长内没有出现人脸崩坏、重影等AI视频生成常见问题。只不过,细看会发现,人物手部“糊”成了一团。
分享就到这里,有迫不及待想要使用Gen-3 Alpha的,可以直接在AI569工具导航站搜索即可。