Stable Audio Open - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

火爆全球的AI音频大模型，最新技术细节揭秘

近日，AI音频领域再掀波澜，Stability AI在其官网宣布在Arxiv上分享了关于其开源文本转音频模型Stable Audio Open的最新研究论文。这一模型自6月推出以来，以其免费、开源的特性迅速受到广泛关注，尤其能生成长达47秒、44.1kHz高质量立体声音频，且能在消费级GPU上运行，...

原文链接

数码游侠

07-24 20:41:58

分享至

打开微信扫一扫

内容投诉

生成图片

Stable Audio Open 开源 AI 模型发布：48.6 万个样本训练，可创建 47 秒短音频 / 音效等

6月6日，Stability AI基于Stable Diffusion模型发布开源AI音频工具Stable Audio Open，利用48.6万样本训练，能根据用户输入生成47秒高质量音乐、鼓点、音效等。该模型采用DiT技术，提升音频质量和多样性，并已在HuggingFace平台上供用户试用。Stability AI强调其适用于创作短片段而非完整歌曲。此前，他们还发布了Stable Audio 2.0，最长支持3分钟音频生成。

原文链接