1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月25日,微软发布开源文本转语音模型VibeVoice-1.5B,可生成最长90分钟、最多4人对话的自然语音,支持跨语言和歌声合成。该模型基于1.5B参数的Qwen2.5架构,结合声学与语义双分词器,通过扩散解码器提升音质表现。其训练上下文长度扩展至65k Tokens,确保长篇对话连贯性,并支持流式生成音频,为实时TTS应用奠定基础。目前仅支持中英双语,暂不支持语音重叠或背景音效。微软强调禁止用于声音冒充、虚假信息传播等非法用途,并提醒标明AI生成来源。模型主要面向科研与开发者社区,未来将推出7B版本,支持低延迟交互与更高保真度,拓展更多应用场景。参考资源已发布在Hugging Face和GitHub平台。

原文链接
本文链接:https://kx.umi6.com/article/24244.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软又“懂”了:称Windows用户渴望AI 反遭网友怒怼!
2025-11-28 16:37:28
微软与OpenAI签署新协议 后者将额外购买2500亿美元的Azure服务
2025-10-28 22:13:03
微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频,MAI-1-preview 剑指 Copilot 文本场景
2025-08-29 08:34:31
浮出水面!微软下一代Maia 2芯片或交由英特尔代工
2025-10-20 16:10:19
每秒 110 万个 token!微软联手英伟达刷新 AI 推理纪录
2025-11-05 16:14:31
微软据悉加大力度抢夺AI人才 瞄准Meta多个团队
2025-08-13 16:38:52
Nscale计划为微软在德克萨斯州建造大型AI数据中心
2025-10-15 18:44:36
马斯克成立新公司「巨硬」:用AI把微软产品重做一遍
2025-08-25 09:23:50
微软独家:OpenAI最新季度净亏损115亿美元
2025-11-01 10:21:05
微软:到2029年在阿联酋投资近80亿美元 用于云和芯片业务
2025-11-03 20:38:57
微软组建超级智能团队 聚焦医疗诊断等领域
2025-11-07 00:25:07
与 OpenAI“划清界限”,微软 AI 负责人苏莱曼称不会推出“成人模式”
2025-10-24 12:37:06
OpenAI走向“算力帝国”
2025-09-22 18:02:48
24小时热文
更多
扫一扫体验小程序