音色创造 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

阿里通义 Qwen3-TTS 家族上新两款 AI 模型：声音不仅能复制，还可以定制

12月24日，阿里通义发布Qwen3-TTS家族两款新模型：音色创造模型Qwen3-TTS-VD-Flash和音色克隆模型Qwen3-TTS-VC-Flash。前者支持通过自然语言指令精细调控音色、情感等，实现高度定制化声音生成，综合表现优于GPT-4o-mini-tts等竞品；后者可基于3秒音频实现多语种音色克隆，支持10种主流语言，平均词错误率（WER）领先MiniMax等模型。两款模型均具备高表现力拟人化音色与强大文本解析能力，适用于复杂文本处理和多样化场景需求。相关API文档已上线，为开发者提供便捷接入方式。

原文链接