1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月25日,微软发布开源文本转语音模型VibeVoice-1.5B,可生成最长90分钟、最多4人对话的自然语音,支持跨语言和歌声合成。该模型基于1.5B参数的Qwen2.5架构,结合声学与语义双分词器,通过扩散解码器提升音质表现。其训练上下文长度扩展至65k Tokens,确保长篇对话连贯性,并支持流式生成音频,为实时TTS应用奠定基础。目前仅支持中英双语,暂不支持语音重叠或背景音效。微软强调禁止用于声音冒充、虚假信息传播等非法用途,并提醒标明AI生成来源。模型主要面向科研与开发者社区,未来将推出7B版本,支持低延迟交互与更高保真度,拓展更多应用场景。参考资源已发布在Hugging Face和GitHub平台。

原文链接
本文链接:https://kx.umi6.com/article/24244.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI走向“算力帝国”
2025-09-22 18:02:48
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
微软CEO纳德拉:每季度在Microsoft Foundry上消费超100万美元的客户增长近80%
2026-01-30 09:19:30
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
微软与Lambda达成数十亿美元的人工智能基础设施协议
2025-11-04 01:50:36
特朗普点名微软:不能让电费上涨
2026-01-13 15:42:36
微软否认下调 AI 销售指标,增长目标≠销售配额
2025-12-05 10:18:06
微软 AI 部门 CEO 苏莱曼:我们要开发出能让家长放心给孩子用的 AI
2025-10-24 14:40:25
微软Office 365将接入Anthropic AI技术 不再依赖OpenAI
2025-09-10 12:36:58
微软宣布其首个自研图像生成模型 MAI-Image-1 已整合入 Bing 与 Copilot,逐步减少对 OpenAI 的依赖
2025-11-05 09:58:04
微软扩大AI算力版图,前矿商IREN获近百亿订单股价暴涨
2025-11-03 21:42:41
Nscale计划为微软在德克萨斯州建造大型AI数据中心
2025-10-15 18:44:36
微软 CEO 纳德拉被曝亲自抓 AI 产品:每周开会、反复问进展、施压负责人
2025-12-23 00:08:48
24小时热文
更多
扫一扫体验小程序