2025-08-01 09:03:26
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
阅读:713
7月31日,微软发布DragonV2.1 Neural零次学习模型,支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音,单词错误率(WER)较前代平均下降12.8%。相比DragonV1,新模型显著提升发音准确性与可控性,适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试,进一步优化用户体验。
原文链接
本文链接:https://kx.umi6.com/article/22779.html
转载请注明文章出处
相关推荐
换一换
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
2025-08-01 09:03:26
美的“美罗 U”首曝,行业首创六臂轮足式人形机器人
2025-12-07 15:33:32
西北首台量子计算机落地西安
2025-12-07 08:18:21
荣耀工程师谈豆包手机:AI 时代新的交互模式探索,未来一定会涌现更多“体验闭环
2025-12-08 10:18:34
甘肃庆阳智算规模达10万P
2025-12-08 16:38:29
山东:2025年人工智能核心产业营收规模预计突破1200亿元 约占全国10%左右
2025-12-08 21:51:18
AI将冲击几乎所有工作!麦肯锡预测:全球高达8亿个岗位会被取代
2025-12-08 11:24:37
厦门“十五五”规划建议:强化算力、算法、数据等高效供给 发展壮大数字经济核心产业
2025-12-08 14:32:20
探索机器人“无遥操”,ATEC2025科技精英赛在港收官
2025-12-08 18:41:52
用AI图仅退款,这批羊毛党把商家薅麻了
2025-12-08 12:24:10
广西“十五五”规划建议:积极发展股权、债券等直接融资 支持上市公司提质
2025-12-07 10:25:53
编程界“奥斯卡”百度之星决赛揭晓,上千选手激烈角逐,山东16岁中学生王茂骅夺冠!
2025-12-08 16:34:59
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
623 文章
367032 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33