1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月11日,智谱发布工业级语音合成系统GLM-TTS,并在Hugging Face和ModelScope平台开源模型权重。该模型仅需3秒语音样本即可克隆音色与说话习惯,适用于教育、电子书、客服等场景,生成自然流畅的语音。其训练数据仅10万小时,远低于行业主流,预训练只需单机4天,成本显著降低。GLM-TTS采用两阶段生成架构和基于GRPO的强化学习方案,在公开评测中达到开源SOTA表现,字符错误率低至0.89%,情感表达领先行业。开发者可通过GitHub、Hugging Face等平台获取资源,或通过开放平台API快速集成。在线体验入口包括audio.z.ai及智谱清言App。

原文链接
本文链接:https://kx.umi6.com/article/30038.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
小米集团AI实验室发布ZipVoice系列语音合成(TTS)模型
2025-09-12 11:11:52
Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格
2025-10-29 16:58:57
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
阿里通义千问 Qwen3-TTS 语音合成 AI 模型发布:超 49 种音色,支持多种方言
2025-12-10 20:05:18
Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
2025-06-09 18:33:05
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
谷歌太壕了!编程Agent大招至简:开源且免费,百万上下文、多模态、MCP全支持
2025-06-26 10:56:45
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
AMD甩出最猛两代AI芯片,算力飙涨、豪气堆料
2025-06-13 12:08:30
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
24小时热文
更多
扫一扫体验小程序