2025-08-01 09:03:26
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
阅读:713
7月31日,微软发布DragonV2.1 Neural零次学习模型,支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音,单词错误率(WER)较前代平均下降12.8%。相比DragonV1,新模型显著提升发音准确性与可控性,适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试,进一步优化用户体验。
原文链接
本文链接:https://kx.umi6.com/article/22779.html
转载请注明文章出处
相关推荐
换一换
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
2025-08-01 09:03:26
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
钟南山:AI不是取代医生 而是为老百姓解决看病贵看病难的问题
2026-01-23 17:07:49
34GB大礼包 AMD显卡AI生产力来了:ComfyUI等5大软件一键部署
2026-01-22 23:17:29
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
苏州“十五五”规划建议:培育壮大半导体与集成电路、智能网联新能源汽车、工业母机等新兴支柱产业
2026-01-21 20:30:12
百川发布循证增强医疗大模型M3 Plus
2026-01-22 14:59:21
中国电信等在天津成立低空量子网络科技发展公司
2026-01-23 10:50:21
AWS上调GPU价格,国产云服务或跟进调整
2026-01-23 17:11:08
如何在 NVIDIA RTX PC 上开始使用视觉生成式 AI
2026-01-23 17:06:39
完全「跑」在 Claude Code 里,会发生什么?
2026-01-23 20:12:20
Mobileye势头强劲,2025财年全年营收同比增长15%
2026-01-23 11:47:43
融捷股份等成立新公司 含多项AI业务
2026-01-22 15:00:25
683 文章
453062 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45