6月6日,Stability AI基于Stable Diffusion模型发布开源AI音频工具Stable Audio Open,利用48.6万样本训练,能根据用户输入生成47秒高质量音乐、鼓点、音效等。该模型采用DiT技术,提升音频质量和多样性,并已在HuggingFace平台上供用户试用。Stability AI强调其适用于创作短片段而非完整歌曲。此前,他们还发布了Stable Audio 2.0,最长支持3分钟音频生成。
原文链接
本文链接:https://kx.umi6.com/article/868.html
转载请注明文章出处
相关推荐
换一换
Kimi K2 Thinking突袭!智能体&推理能力超GPT-5,网友:再次缩小开源闭源差距
2025-11-07 10:43:45
小米具身大模型 MiMo-Embodied 发布并全面开源,业界首个打通自动驾驶与具身智能
2025-11-21 18:38:45
OpenAI 深夜炸场:家族最强视频生成模型 Sora 2 发布,还能同步生成音频
2025-10-01 08:39:42
OpenAI 开源模型发布推迟至夏末,CEO 奥尔特曼称“非常值得等待”
2025-06-11 09:03:41
小米网页 AI 聊天服务惊喜亮相,MiMo-V2-Flash 模型发布、代码能力开源最强
2025-12-17 00:07:31
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
2025-09-08 13:58:15
Altman对话YC总裁:OpenAI的开源模型将远超期待
2025-06-23 10:30:02
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA
2025-07-29 15:31:43
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
DeepSeek 丢了开源第一王座,但继任者“Kimi K2”依然来自中国
2025-07-18 18:42:56
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
659 文章
430352 浏览
24小时热文
更多
-
2026-01-23 20:15:45 -
2026-01-23 20:14:36 -
2026-01-23 20:13:28