1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

8月25日,微软发布开源文本转语音模型VibeVoice-1.5B,可生成最长90分钟、最多4人对话的自然语音,支持跨语言和歌声合成。该模型基于1.5B参数的Qwen2.5架构,结合声学与语义双分词器,通过扩散解码器提升音质表现。其训练上下文长度扩展至65k Tokens,确保长篇对话连贯性,并支持流式生成音频,为实时TTS应用奠定基础。目前仅支持中英双语,暂不支持语音重叠或背景音效。微软强调禁止用于声音冒充、虚假信息传播等非法用途,并提醒标明AI生成来源。模型主要面向科研与开发者社区,未来将推出7B版本,支持低延迟交互与更高保真度,拓展更多应用场景。参考资源已发布在Hugging Face和GitHub平台。

原文链接
本文链接:https://kx.umi6.com/article/24244.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软首席科学家警告:特朗普政府提议禁止各州监管人工智能将阻碍技术发展
2025-06-23 15:24:49
微软 CEO 纳德拉:公司 20%-30% 的代码由 AI 生成
2025-04-30 19:41:27
微软大裁员后 Xbox发布AI招聘图片惨遭猛批!出现明显低级错误
2025-07-15 17:51:16
微软承认可能数据中心建设进度无法及时跟上,恐将导致 AI 服务出现中断
2025-05-01 17:29:43
微软三任CEO同台,被AI三连追问
2025-05-16 17:53:28
英超联赛与微软宣布建立五年战略合作伙伴关系
2025-07-02 08:34:29
微软将首席信息安全官调至云与AI事业部
2025-06-27 11:06:54
OpenAI的「独立战争」
2025-07-05 11:58:16
微软在Edge加入Copilot模式
2025-07-29 08:27:18
程序员危!微软CEO纳德拉:公司高达30%代码是AI写的
2025-04-30 20:19:15
微软达夫卢里:下一代Windows系统的语音功能将更加重要
2025-08-14 22:06:23
微软推出 Win11 设备端小型语言模型 Mu,助力系统设置自然语言搜索体验
2025-06-24 09:14:42
微软推出可代人编码的人工智能代理
2025-05-20 09:36:40
24小时热文
更多
扫一扫体验小程序