2025-08-01 09:03:26
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
阅读:509
7月31日,微软发布DragonV2.1 Neural零次学习模型,支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音,单词错误率(WER)较前代平均下降12.8%。相比DragonV1,新模型显著提升发音准确性与可控性,适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试,进一步优化用户体验。
原文链接
本文链接:https://kx.umi6.com/article/22779.html
转载请注明文章出处
相关推荐
.png)
换一换
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
2025-08-01 09:03:26
马斯克刚关注了这份AI报告
2025-09-19 15:13:37
全球首个深度推理+多模态大模型“紫东太初”4.0发布
2025-09-19 13:13:31
瑞德智能:正积极布局AI健康管理及能源管理领域研发工作
2025-09-20 11:27:53
OpenAI领衔!AI热潮下美国“七大科技初创”总估值达1.3万亿美元
2025-09-21 09:41:55
刘慈欣谈AI焦虑:我们并没有什么是AI不可替代的
2025-09-21 15:46:46
海淀105款大模型背后:看这些AI玩家如何抢占内容生产制高点
2025-09-19 16:17:49
戴尔服务器率先导入 PCIe AIC 形态英特尔 Gaudi 3 AI 加速器配置
2025-09-19 15:14:48
经济日报:别再搞一哄而上的“人工智能+”
2025-09-21 08:41:37
自研主控芯片部署规模将实现放量增长 国产芯片概念股单日涨超12% 本周机构密集调研相关上市公司
2025-09-21 22:50:30
研究显示人工智能新工具可用于预测长期疾病风险
2025-09-20 20:35:43
初代AI网红口碑翻身,让年轻人气哭又看笑
2025-09-21 12:43:52
鸿蒙进击:华为正式启动“天工计划”,将投入 10 亿元支持 AI 生态创新
2025-09-21 14:45:12
528 文章
205736 浏览
24小时热文
更多

-
2025-09-21 23:49:45
-
2025-09-21 22:50:30
-
2025-09-21 22:49:22