1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月25日,微软发布开源文本转语音模型VibeVoice-1.5B,可生成最长90分钟、最多4人对话的自然语音,支持跨语言和歌声合成。该模型基于1.5B参数的Qwen2.5架构,结合声学与语义双分词器,通过扩散解码器提升音质表现。其训练上下文长度扩展至65k Tokens,确保长篇对话连贯性,并支持流式生成音频,为实时TTS应用奠定基础。目前仅支持中英双语,暂不支持语音重叠或背景音效。微软强调禁止用于声音冒充、虚假信息传播等非法用途,并提醒标明AI生成来源。模型主要面向科研与开发者社区,未来将推出7B版本,支持低延迟交互与更高保真度,拓展更多应用场景。参考资源已发布在Hugging Face和GitHub平台。

原文链接
本文链接:https://kx.umi6.com/article/24244.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软宣布引入GPT-oss模型
2025-08-06 09:27:44
微软将在英国投资300亿美元 用于人工智能基础设施建设与运营
2025-09-17 06:23:22
英超联赛与微软宣布建立五年战略合作伙伴关系
2025-07-02 08:34:29
马斯克炮轰 OpenAI 被微软拿捏,纳德拉回帖称期待 Grok 5 到来
2025-08-09 12:31:01
两个月斩获微软四笔订单 “英版甲骨文”或计划明年IPO
2025-10-16 00:43:21
微软邀测必应视频创建器:免费 AI 生成视频,基于 OpenAI Sora 模型,最长 5 秒、最高 480P
2025-05-23 09:48:17
闭源主力选手拥抱开源?OpenAI 被曝最快下周推开源 AI 模型,o3 mini 级推理能力
2025-07-10 11:22:08
微软 CEO 纳德拉解释公司为何边赚钱边裁员,员工质疑“眼里只有 KPI”
2025-07-26 18:46:04
微软将人工智能服务融入Office 以挑战ChatGPT
2025-10-02 00:56:00
刚刚,微软推出AI浏览器,上网从此不一样了
2025-07-29 09:25:32
微软为何豪掷17亿美金“埋粪”?
2025-08-04 22:06:20
微软将对AI模型的“安全性”进行排名
2025-06-09 14:28:33
微软宣称AI节省5亿美元成本 再次裁员近万人
2025-07-10 09:15:35
24小时热文
更多
扫一扫体验小程序