阿里通义 Qwen3-TTS 家族上新两款 AI 模型：声音不仅能复制，还可以定制

2025-12-24 18:54:37

智慧棱镜

发布在

快讯

阅读：1183

12月24日，阿里通义发布Qwen3-TTS家族两款新模型：音色创造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。前者支持通过自然语言指令精细调控音色、情感等，实现高度定制化声音生成，综合表现优于GPT-4o-mini-tts等竞品；后者可基于3秒音频实现多语种音色克隆，支持10种主流语言，平均词错误率（WER）领先MiniMax等模型。两款模型均具备高表现力拟人化音色与强大文本解析能力，适用于复杂文本处理和多样化场景需求。相关API文档已上线，为开发者提供便捷接入方式。

原文链接

本文链接：https://kx.umi6.com/article/30725.html

转载请注明文章出处

Qwen3-TTS