复活已故亲人，必备AI工具和最详细教程

AI教程 2024-03-29

最近，“用AI工具复活已故亲人”成为热议话题，那么具体如何操作呢？下面为大家详细介绍操作过程。

首先，需要准备以下材料：

1.一张已故亲人的清晰正面照片，如果照片不够清晰，可以借助“Wink”这类工具进行修复。

2.一段10秒钟以上的清晰语音，语音越长效果越好，最好能有1分钟以上。

接下来，准备以下工具：

1.“GPTSOVITS”是一个免费开源的语音克隆软件，用于克隆亲人的声音。当然，还有百度飞桨、11Labs等其他有效工具可供选择。

2.“ChatGPT”通过训练，可以模拟出亲人的说话风格。

3.“Midjourney”能够改变亲人的外貌，如果技术不够熟练，可以直接使用原照片。

4.“D-ID”则是根据克隆的语音进行照片的视频化。此外，HeyGen、Yepic等工具也能达到类似效果，但各有差异，感兴趣的话可以都尝试一下。

准备工作完成后，就可以开始操作了。

第一步是训练声音。打开GPTSOVITS软件，基于Google进行操作。进入colab笔记本后，点击“全部运行”。等待运行完成，大约需要10分钟左右。当看到日志出现“Running on public URL”时，说明启动成功，点击这个URL打开web界面。

第二步是声音上传和处理。准备一段干声音频文件用于训练，最好是在安静环境下录制的。如果音频中有背景声或其他杂音，需要进行人声分离处理。

使用UVR5软件提取出干净的人声，然后进行音频切割，以避免爆显存。切割完成后，还需要进行自动打标和人工校对，以确保音频与文字的对应关系准确。

第三步是训练模型。首先进行数据集格式化，填写相关信息并设置路径。然后分别点击三个按钮进行预处理。接着开始SoVITS训练，设置模型名称、batch size和训练轮数。训练过程中可以查看显卡占用情况，如果出现爆显存现象，需要调整batch size或再次切割过长的音频。训练完成后，会生成相应的模型文件。