阿里巴巴最新开源AI工具——EchoMimic:让照片说话唱歌动起来!
之前给大家介绍过好几款能让照片“活起来”的AI工具:EMO、LivePortrait,今天再和大家聊聊蚂蚁集团最近推出的EchoMimic,一起来感受一下有何不同~
项目介绍
EchoMimic 是一种创新的肖像图像动画技术,它能够通过音频信号和面部关键点的组合来生成逼真的“说话的头部”视频,由阿里巴巴达摩院开发。
在此之前的同类工具都只能用音频或者只用面部关键点的方法,会出现不稳定、不自然的状况,而EchoMimic的组合拳相当于给数字人开了挂!
EchoMimic主要有以下几个特点:
· 口型同步生成:能根据音频和面部照片,创造出口型动作与语音完美匹配的视频。
· 自然逼真:它会融合音频和面部特征,生成的面部动画看起来很符合真实的面部运动和表情变化。
· 多语言支持:不仅支持普通话,还能处理英语和歌唱等多种语言和风格。
项目地址
• Github地址:https://github.com/BadToBest/EchoMimic
• 项目主页:https://badtobest.github.io/echomimic.html
@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!