1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月11日,智谱发布工业级语音合成系统GLM-TTS,并在Hugging Face和ModelScope平台开源模型权重。该模型仅需3秒语音样本即可克隆音色与说话习惯,适用于教育、电子书、客服等场景,生成自然流畅的语音。其训练数据仅10万小时,远低于行业主流,预训练只需单机4天,成本显著降低。GLM-TTS采用两阶段生成架构和基于GRPO的强化学习方案,在公开评测中达到开源SOTA表现,字符错误率低至0.89%,情感表达领先行业。开发者可通过GitHub、Hugging Face等平台获取资源,或通过开放平台API快速集成。在线体验入口包括audio.z.ai及智谱清言App。

原文链接
本文链接:https://kx.umi6.com/article/30038.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
睿尔曼开源全球首个高质量、模态数量最多的真机数据集
2025-11-24 20:12:19
大厂AI各走「开源」路
2025-10-17 09:09:57
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
千问语音识别模型Qwen3-ASR开源!饶舌RAP歌曲也能轻松识别
2026-01-30 11:21:16
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
面壁智能 AgentCPM-Explore 小模型开源:仅 4B 参数,挑战端侧智能体部署
2026-01-14 15:42:31
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
豆包发布语音合成 / 声音复刻等四款大模型:能理解情感、调节音调风格、准确读出公式
2025-10-16 12:53:38
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
24小时热文
更多
扫一扫体验小程序