综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,AI音频领域再掀波澜,Stability AI在其官网宣布在Arxiv上分享了关于其开源文本转音频模型Stable Audio Open的最新研究论文。这一模型自6月推出以来,以其免费、开源的特性迅速受到广泛关注,尤其能生成长达47秒、44.1kHz高质量立体声音频,且能在消费级GPU上运行,...
原文链接
6月6日,Stability AI基于Stable Diffusion模型发布开源AI音频工具Stable Audio Open,利用48.6万样本训练,能根据用户输入生成47秒高质量音乐、鼓点、音效等。该模型采用DiT技术,提升音频质量和多样性,并已在HuggingFace平台上供用户试用。Stability AI强调其适用于创作短片段而非完整歌曲。此前,他们还发布了Stable Audio 2.0,最长支持3分钟音频生成。
原文链接
加载更多
暂无内容