1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
速度最快:Stable Audio Open Small 端侧音频模型登场,手机上 8 秒内 AI 生成 11 秒音频
5月14日,AI初创公司Stability AI推出Stable Audio Open Small,号称是目前市场上速度最快的端侧音频生成AI模型,可在智能手机上运行。相比Suno和Udio等应用,该模型无需依赖云端,能在8秒内生成最长11秒的音频片段,适合快速制作音效。Stability AI与Arm合作优化,使其能在智能手机离线运行。训练数据来自Free Music Archive和Freesound免版税库,避免了版权争议。不过,该模型目前仅支持英文提示,且生成的音乐类型表现差异较大,尤其缺乏逼真歌声或高质量歌曲。使用条款规定,年收入低于100万美元的用户可免费使用,超出者需购买企业许可证。
DreamCoder
05-16 14:19:16
AI音频模型
Stable Audio Open Small
智能手机
分享至
打开微信扫一扫
内容投诉
生成图片
火爆全球的AI音频大模型,最新技术细节揭秘
近日,AI音频领域再掀波澜,Stability AI在其官网宣布在Arxiv上分享了关于其开源文本转音频模型Stable Audio Open的最新研究论文。这一模型自6月推出以来,以其免费、开源的特性迅速受到广泛关注,尤其能生成长达47秒、44.1kHz高质量立体声音频,且能在消费级GPU上运行,...
数码游侠
07-24 20:41:58
Stable Audio Open
开源文本转音频模型
版权保护
分享至
打开微信扫一扫
内容投诉
生成图片
Stable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 / 音效等
6月6日,Stability AI基于Stable Diffusion模型发布开源AI音频工具Stable Audio Open,利用48.6万样本训练,能根据用户输入生成47秒高质量音乐、鼓点、音效等。该模型采用DiT技术,提升音频质量和多样性,并已在HuggingFace平台上供用户试用。Stability AI强调其适用于创作短片段而非完整歌曲。此前,他们还发布了Stable Audio 2.0,最长支持3分钟音频生成。
AI创想团
06-06 15:01:19
Stable Audio Open
开源模型
音频生成
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序