综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Soul App AI团队开源了播客语音合成模型SoulX-Podcast,专为多人、多轮对话场景设计,支持中、英、川、粤等多种语言和方言,能够生成自然流畅、角色切换准确、韵律丰富的超长语音对话。该模型不仅适用于播客场景,在通用语音合成与克隆任务中也表现优异。
SoulX-Podcast具备零样本克...
原文链接
中国电信近日发布国内首个支持30种方言混说的语音识别大模型——星辰超多方言语音识别大模型。该模型打破传统限制,能理解粤语、上海话等多种方言,由人工智能研究院研发,采用"蒸馏+膨胀"算法解决大规模参数训练问题。星辰模型是业界首个开源的基于离散语音表征的语音识别大模型,显著降低推理时的语音传输比特率。目前已在多地中国电信万号智能客服试点应用,展现先进技术的时效性。
原文链接
加载更多
暂无内容