DragonV2.1 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

微软发布 DragonV2.1 模型：AI 转录语音更自然，单词错误率平均下降 12.8%、支持合成超 100 种语言

7月31日，微软发布DragonV2.1 Neural零次学习模型，支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音，单词错误率（WER）较前代平均下降12.8%。相比DragonV1，新模型显著提升发音准确性与可控性，适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试，进一步优化用户体验。

原文链接