复活已故亲人,必备AI工具和最详细教程

AI教程 2024-03-29

最近,“用AI工具复活已故亲人”成为热议话题,那么具体如何操作呢?下面为大家详细介绍操作过程。

首先,需要准备以下材料:

1.一张已故亲人的清晰正面照片,如果照片不够清晰,可以借助“Wink”这类工具进行修复。

2.一段10秒钟以上的清晰语音,语音越长效果越好,最好能有1分钟以上。

接下来,准备以下工具:

1.“GPTSOVITS”是一个免费开源的语音克隆软件,用于克隆亲人的声音。当然,还有百度飞桨、11Labs等其他有效工具可供选择。

2.“ChatGPT”通过训练,可以模拟出亲人的说话风格。

3.“Midjourney”能够改变亲人的外貌,如果技术不够熟练,可以直接使用原照片。

4.“D-ID”则是根据克隆的语音进行照片的视频化。此外,HeyGen、Yepic等工具也能达到类似效果,但各有差异,感兴趣的话可以都尝试一下。

准备工作完成后,就可以开始操作了。

第一步是训练声音。打开GPTSOVITS软件,基于Google进行操作。进入colab笔记本后,点击“全部运行”。等待运行完成,大约需要10分钟左右。当看到日志出现“Running on public URL”时,说明启动成功,点击这个URL打开web界面。

image.png

第二步是声音上传和处理。准备一段干声音频文件用于训练,最好是在安静环境下录制的。如果音频中有背景声或其他杂音,需要进行人声分离处理。

image.png

使用UVR5软件提取出干净的人声,然后进行音频切割,以避免爆显存。切割完成后,还需要进行自动打标和人工校对,以确保音频与文字的对应关系准确。

image.png

第三步是训练模型。首先进行数据集格式化,填写相关信息并设置路径。然后分别点击三个按钮进行预处理。接着开始SoVITS训练,设置模型名称、batch size和训练轮数。训练过程中可以查看显卡占用情况,如果出现爆显存现象,需要调整batch size或再次切割过长的音频。训练完成后,会生成相应的模型文件。

image.png

最后一步是推理。打开推理界面,设置相关参数,开始文本转语音。稍等片刻后,即可试听并下载生成的语音文件。在推理过程中,选择合适的参考音频非常重要,它会学习语速和语气,使生成的语音更加逼真。

image.png

通过以上步骤,就可以利用AI工具“复活”已故亲人的声音了。需要注意的是,虽然技术已经取得了一定的进步,但生成的语音仍可能存在一定的差异和局限性。因此,在使用这些工具时,应保持理性和客观的态度。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章