Resemble 是一个完整的 AI 语音工具包,包括文本转语音、语音转语音、神经音频编辑和语言配音等功能。 它允许用户在几秒钟内创建逼真的人声,它还可以克隆自己的声音。 目前,Resemble 每月能够生成超过 200,135 条 AI 语音,总计超过 2,000,000 分钟的音频。
语音克隆:只需要提供5分钟左右的语音样本,就可以创建一个与原声音相似的人工智能模型,并用它来合成任意文本的语音。还可以选择不同的语言、口音、风格和情感,让生成的语音更加符合场景和目标。
语音参数:通过输入文本,生成对应的语音内容。选择自己创建或者预置的语音角色,也可以在文本中添加标签,来控制语音的情感、语调、语速、口音等参数。还可以预览和编辑生成的语音内容,以及下载或分享给他人。
配音风格:通过选择不同的风格模板,来改变自己或他人的声音。例如可以让自己或他人的声音听起来像是在唱歌、说笑话、播新闻、说方言等。还可以自定义风格模板,或者使用其他用户分享的风格模板。
配音脚本:通过上传或编写配音剧本,来批量生成多个角色之间对话的语音内容。为每个角色分配不同的声音,并且支持在剧本中添加标签,来控制每个角色说话时候的情感、语调、语速、口音等参数。还可以预览和编辑生成的对话内容,以及下载或分享给他人。
实时语音转换:实时地将自己的声音转换成目标声音,并与之对话。控制生成声音的细节,如节奏、强调、抑扬等。让用户体验不同的声音角色。
语言本地化:将自己的声音转换成任意语言,而无需提供任何数据。可以用自己的声音跨越国界,触达全球受众。用于广告、媒体、旅游等场景,让用户传递更加亲切和专业的信息。
人工智能填充:将自己真实录制的语音和合成的语音混合使用,实现无缝隙。用于修正、补充或删除语音内容,实现无缝的语音体验。
人工智能生成文本:利用resemble.ai与GPT-3的集成,让人工智能自动为用户生成合适的文本内容,并用生成的语音朗读出来。创建动态的对话、故事、广告等语音应用。
神经音频编辑:像编辑文本一样,对生成的语音进行剪切、复制、粘贴、替换等操作,轻松地修改和优化语音内容。还可以调整语音的音量、速度、音高等参数,让语音更加自然和流畅。
基础版:价格是每秒0.006美元,可以在网页上录制自定义的声音,最多可以创建10个声音,只支持英语。还可以使用超过50个市场上的声音,并且可以无限制地下载生成的语音内容。基础版没有最低消费要求,只需要按照实际使用量付费即可。
专业版:价格需要根据客户的具体需求和规模联系resemble.ai进行咨询。提供了更多的高级功能,如上传自定义数据、实时语音转换、增强情感控制、低延迟API、跨语言支持等。还支持语音创建API,通过编程方式创建和管理声音。此外专业版还提供了在本地部署和移动端部署的选项。