综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月10日,阿里通义千问发布Qwen3-TTS语音合成AI模型,支持超49种音色及多种方言。新模型可通过Qwen API访问,提供撒娇搞怪、青梅竹马等角色音色,覆盖不同性别、年龄和地域特征。Qwen3-TTS增强多语种能力,支持中文、英文、日语等10种语言,方言包括闽南语、粤语、四川话等,还原地方口音特色。此外,其韵律和语速调节更自然,拟人化程度逼近真人,性能优于MiniMax、ElevenLabs等同类产品。
原文链接
Soul App AI团队开源了播客语音合成模型SoulX-Podcast,专为多人、多轮对话场景设计,支持中、英、川、粤等多种语言和方言,能够生成自然流畅、角色切换准确、韵律丰富的超长语音对话。该模型不仅适用于播客场景,在通用语音合成与克隆任务中也表现优异。
SoulX-Podcast具备零样本克...
原文链接
中国电信近日发布国内首个支持30种方言混说的语音识别大模型——星辰超多方言语音识别大模型。该模型打破传统限制,能理解粤语、上海话等多种方言,由人工智能研究院研发,采用"蒸馏+膨胀"算法解决大规模参数训练问题。星辰模型是业界首个开源的基于离散语音表征的语音识别大模型,显著降低推理时的语音传输比特率。目前已在多地中国电信万号智能客服试点应用,展现先进技术的时效性。
原文链接
加载更多
暂无内容