
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月31日,微软发布DragonV2.1 Neural零次学习模型,支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音,单词错误率(WER)较前代平均下降12.8%。相比DragonV1,新模型显著提升发音准确性与可控性,适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试,进一步优化用户体验。
原文链接
加载更多

暂无内容