阿里巴巴最新开源AI工具——EchoMimic:让照片说话唱歌动起来!

AI快讯 2024-07-24

之前给大家介绍过好几款能让照片“活起来”的AI工具:EMO、LivePortrait,今天再和大家聊聊蚂蚁集团最近推出的EchoMimic,一起来感受一下有何不同~

项目介绍

image.png

EchoMimic 是一种创新的肖像图像动画技术,它能够通过音频信号和面部关键点的组合来生成逼真的“说话的头部”视频,由阿里巴巴达摩院开发。

在此之前的同类工具都只能用音频或者只用面部关键点的方法,会出现不稳定、不自然的状况,而EchoMimic的组合拳相当于给数字人开了挂!

EchoMimic主要有以下几个特点:

· 口型同步生成:能根据音频和面部照片,创造出口型动作与语音完美匹配的视频。

· 自然逼真:它会融合音频和面部特征,生成的面部动画看起来很符合真实的面部运动和表情变化。

· 多语言支持:不仅支持普通话,还能处理英语和歌唱等多种语言和风格。

项目地址

• Github地址:https://github.com/BadToBest/EchoMimic

• 项目主页:https://badtobest.github.io/echomimic.html

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章