1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月11日,智谱发布工业级语音合成系统GLM-TTS,并在Hugging Face和ModelScope平台开源模型权重。该模型仅需3秒语音样本即可克隆音色与说话习惯,适用于教育、电子书、客服等场景,生成自然流畅的语音。其训练数据仅10万小时,远低于行业主流,预训练只需单机4天,成本显著降低。GLM-TTS采用两阶段生成架构和基于GRPO的强化学习方案,在公开评测中达到开源SOTA表现,字符错误率低至0.89%,情感表达领先行业。开发者可通过GitHub、Hugging Face等平台获取资源,或通过开放平台API快速集成。在线体验入口包括audio.z.ai及智谱清言App。

原文链接
本文链接:https://kx.umi6.com/article/30038.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
用编程大模型登顶开源第一后,智谱GLM团队被拷问了3小时
2025-12-25 11:29:48
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
面壁智能 AgentCPM-Explore 小模型开源:仅 4B 参数,挑战端侧智能体部署
2026-01-14 15:42:31
睿尔曼开源全球首个高质量、模态数量最多的真机数据集
2025-11-24 20:12:19
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
大厂AI各走「开源」路
2025-10-17 09:09:57
三家混战,大模型重回2023
2025-08-03 11:35:50
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
24小时热文
更多
扫一扫体验小程序