AI迎来新声浪!Stability AI发布AI音频模型Stable Audio Open

AI快讯 2024-06-06

Stability AI今日揭幕Stable Audio Open 1.0版本,这是该公司在音频领域推出的全新生成式AI模型。众所周知,Stability AI以其出色的文本到图像生成技术而备受瞩目,但这一新成果无疑进一步拓宽了公司的产品线。自2023年Stable Audio问世以来,它已成为一款备受期待的文本到音频转换工具,而最新的Stable Audio Open 1.0则在音频清晰度和长度上实现了显著提升。

相较于商业版的Stable Audio,其广泛应用于各类商业场景并支持长达3分钟的音频生成,Stable Audio Open则专注于生成短音效片段,满足特定需求。

值得注意的是,Stable Audio Open虽然名为“开放”,但并非传统意义上的开源项目。它遵循Stability AI的非商业研究社区协议许可证,旨在为用户提供模型的开放访问权限,同时确保使用过程中的合规性。

image.png

Stability AI音频研究团队的领军人物Zach Evans表示:“Stable Audio Open的推出,旨在让音频研究人员和制作人能够亲身体验我们的生成音频技术,加速这一领域的研究、应用和创新。”

Stable Audio Open专注于音乐制作和声音设计领域,通过优化鼓点、乐器乐段、环境声音等音频样本的生成,为用户提供高质量的音频素材。尽管其生成的音频长度限制在47秒,但其音质表现却相当出色。

在模型训练方面,Stability AI秉持负责任的态度,仅使用FreeSound和免费音乐档案中的音频数据进行训练,确保不侵犯任何版权或专有权益。

此外,Stable Audio Open还允许用户根据自定义音频数据对模型进行微调。例如,鼓手可以利用自己的鼓声录音样本对模型进行微调,生成独特且符合个人风格的节拍。这一功能的实现得益于稳定音频工具库的支持,该工具库遵循实际开源许可证的授权。

Evans进一步表示:“我们的音频研究团队一直致力于提升生成音频模型的质量和可控性。未来,我们将继续发布更多商业和开放模型,以展示我们在这一领域的最新研究成果。”Stable Audio Open 1.0的发布无疑为音频领域注入了新的活力,让我们期待Stability AI未来更多的创新成果。

@版权声明:部分内容从网络收集整理,如有侵权,请联系删除!

相关文章