12日,小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型。该系列包括ZipVoice(零样本单说话人语音合成模型)和ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice通过基于Flow Matching架构解决了现有零样本语音合成模型参数量大、合成速度慢的问题;ZipVoice-Dialog则优化了对话语音合成的稳定性和推理速度瓶颈。这一发布展现了小米在人工智能语音技术领域的创新突破,为行业提供了更高效的语音合成解决方案。
原文链接
本文链接:https://kx.umi6.com/article/25116.html
转载请注明文章出处
相关推荐
换一换
阿里通义千问 Qwen3-TTS 语音合成 AI 模型发布:超 49 种音色,支持多种方言
2025-12-10 20:05:18
小米投资的具身智能公司新动作,联合焊接巨头开发大模型机器人
2024-07-23 10:40:18
Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格
2025-10-29 16:58:57
武汉大学人工智能学院成立,小米集团称期待合作
2024-12-16 13:37:30
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌
2025-06-16 09:05:32
豆包发布语音合成 / 声音复刻等四款大模型:能理解情感、调节音调风格、准确读出公式
2025-10-16 12:53:38
小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型
2025-09-12 11:11:52
AI泡沫化引发全球担忧情绪:一夜之间美股、金银、比特币、石油全崩了
2026-02-06 10:45:09
继屏蔽千问后 微信再封元宝分享口令
2026-02-06 14:56:44
Claude一个插件吓哭华尔街,软件公司集体暴跌,2万亿元一日蒸发
2026-02-05 20:07:14
全国首个3万卡AI集群上线:兼容CUDA 可支持万亿参数大模型
2026-02-05 22:13:01
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
2026-02-06 11:46:30
710 文章
502365 浏览
24小时热文
更多
-
2026-02-07 00:22:55 -
2026-02-06 22:16:33 -
2026-02-06 20:13:16