6月6日,Stability AI基于Stable Diffusion模型发布开源AI音频工具Stable Audio Open,利用48.6万样本训练,能根据用户输入生成47秒高质量音乐、鼓点、音效等。该模型采用DiT技术,提升音频质量和多样性,并已在HuggingFace平台上供用户试用。Stability AI强调其适用于创作短片段而非完整歌曲。此前,他们还发布了Stable Audio 2.0,最长支持3分钟音频生成。
原文链接
本文链接:https://kx.umi6.com/article/868.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
Meta首席科学家杨立昆谈DeepSeek:开源模型正在超越专有模型
2025-01-27 08:27:22
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
2025-06-06 16:36:35
447 文章
69882 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13