12月24日,阿里通义发布Qwen3-TTS家族两款新模型:音色创造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。前者支持通过自然语言指令精细调控音色、情感等,实现高度定制化声音生成,综合表现优于GPT-4o-mini-tts等竞品;后者可基于3秒音频实现多语种音色克隆,支持10种主流语言,平均词错误率(WER)领先MiniMax等模型。两款模型均具备高表现力拟人化音色与强大文本解析能力,适用于复杂文本处理和多样化场景需求。相关API文档已上线,为开发者提供便捷接入方式。
原文链接
本文链接:https://kx.umi6.com/article/30725.html
转载请注明文章出处
相关推荐
换一换
阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制
2025-12-24 18:54:37
阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言
2025-12-15 16:47:57
阿里通义千问 Qwen3-TTS 语音合成 AI 模型发布:超 49 种音色,支持多种方言
2025-12-10 20:05:18
网文作家遇职业危机!AI写作48小时生成500万字长篇小说
2026-03-08 15:12:48
谨防诈骗!OpenClaw创始人否认入驻微博等中文社交平台
2026-03-08 14:07:08
埃斯顿(2715.HK)今日登陆港交所 国产机器人龙头开启A+H新征程
2026-03-09 09:27:00
全国人大代表杭迎伟:打造水务全产业链机器人矩阵
2026-03-06 19:29:11
周鸿祎:只有通过多智能体协作 才能让人工智能真正落地
2026-03-07 21:02:28
央视点赞千问APP,“AI办事”让人工智能走进日常生活
2026-03-07 16:42:54
超智算智能算力中心揭牌暨AI算力设备点亮仪式成功举行
2026-03-06 20:29:36
首个物理AI数据基座平台“无垠”落户浙江,专治机器人数据荒,家庭工业商业场景全覆盖
2026-03-09 19:00:56
国家发展改革委主任:“十五五”末人工智能相关产业规模将增长到10万亿元以上
2026-03-06 16:15:23
近千名爱好者在深圳腾讯大厦门口排队安装OpenClaw 今早11点预约号发放完毕
2026-03-06 17:21:47
700 文章
477322 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22