微软发布 DragonV2.1 模型：AI 转录语音更自然，单词错误率平均下降 12.8%、支持合成超 100 种语言

2025-08-01 09:03:26

E-Poet

发布在

快讯

阅读：713

7月31日，微软发布DragonV2.1 Neural零次学习模型，支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音，单词错误率（WER）较前代平均下降12.8%。相比DragonV1，新模型显著提升发音准确性与可控性，适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试，进一步优化用户体验。

原文链接

本文链接：https://kx.umi6.com/article/22779.html

转载请注明文章出处

DragonV2.1