12日,小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型。该系列包括ZipVoice(零样本单说话人语音合成模型)和ZipVoice-Dialog(零样本对话语音合成模型)。ZipVoice通过基于Flow Matching架构解决了现有零样本语音合成模型参数量大、合成速度慢的问题;ZipVoice-Dialog则优化了对话语音合成的稳定性和推理速度瓶颈。这一发布展现了小米在人工智能语音技术领域的创新突破,为行业提供了更高效的语音合成解决方案。
原文链接
本文链接:https://kx.umi6.com/article/25116.html
转载请注明文章出处
相关推荐
换一换
Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格
2025-10-29 16:58:57
武汉大学人工智能学院成立,小米集团称期待合作
2024-12-16 13:37:30
小米投资的具身智能公司新动作,联合焊接巨头开发大模型机器人
2024-07-23 10:40:18
小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型
2025-09-12 11:11:52
脑机接口技术迎来重大突破:可使渐冻症患者重新流畅说话、唱歌
2025-06-16 09:05:32
豆包发布语音合成 / 声音复刻等四款大模型:能理解情感、调节音调风格、准确读出公式
2025-10-16 12:53:38
黄仁勋、马斯克背书 世界模型何以成为通往物理AI的钥匙?
2025-11-01 09:20:48
原神LOL齐聚的Unity开发者大会,我看到了AI游戏的未来
2025-11-01 13:30:14
黄仁勋:AI产业已进入“良性循环”,全球万亿级算力基建才刚起步
2025-10-31 19:49:43
史上最大IPO要来了?OpenAI据称筹备上市 冲击万亿美元估值
2025-10-30 13:44:27
GPU 资源告急,OpenAI 计划减少 Sora 免费生成视频次数
2025-10-31 07:20:30
小米、海信等在浙江成立智屏视界科技公司 注册资本5000万
2025-10-31 15:40:41
美国AI巨头年内发债规模超2000亿美元 分析师担忧引发系统性风险
2025-11-01 17:42:00
585 文章
305971 浏览
24小时热文
更多
-
2025-11-01 18:42:13 -
2025-11-01 17:42:00 -
2025-11-01 17:39:52