1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

7月31日,微软发布DragonV2.1 Neural零次学习模型,支持超100种语言的语音合成。该模型通过少量数据即可生成自然、表现力强的声音,单词错误率(WER)较前代平均下降12.8%。相比DragonV1,新模型显著提升发音准确性与可控性,适用于多场景如聊天机器人定制和视频跨语言配音。用户可通过SSML音素标签和自定义词典调整发音细节。微软还提供Andrew、Ava和Brian等声音档案供测试,进一步优化用户体验。

原文链接
本文链接:https://kx.umi6.com/article/22779.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软发布 DragonV2.1 模型:AI 转录语音更自然,单词错误率平均下降 12.8%、支持合成超 100 种语言
2025-08-01 09:03:26
IDC:预测到2029年全球机器人市场规模将超过4000亿美元
2025-08-01 09:21:12
独家 | 对话百度副总裁平晓黎:深度复盘数字人业务逻辑
2025-08-01 09:12:15
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
2025-08-01 15:06:32
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
2025-08-02 10:14:11
你在为Figma上市欢呼,Figma可不敢为AI狂欢
2025-08-02 11:16:32
Ilya之后,两位90后撑起OpenAI核心研究
2025-08-01 15:04:33
AWS云计算还是亚马逊的“现金牛”吗?
2025-08-02 08:12:48
国常会:要深入实施“人工智能+”行动,大力推进人工智能规模化商业化应用
2025-08-01 09:17:48
剑指打造具身智能“Windows系统” 智元机器人发布“灵渠OS”开源计划
2025-08-01 09:19:33
上海:加快打造具有国际影响力的人工智能发展高地
2025-08-01 09:23:28
国家发改委:目前处在人工智能应用落地的关键窗口期
2025-08-01 10:58:45
青岛市南区发布人工智能三年行动方案 力争产业规模突破200亿元
2025-08-01 09:25:08
24小时热文
更多
扫一扫体验小程序