
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月18日,面壁智能发布语音生成基座模型VoxCPM,参数规模为0.5B。该模型由面壁智能与清华大学深圳国际研究生院联合研发,具备合成语音自然度、音色相似度及韵律表现力的SOTA水平,已开源至GitHub、Hugging Face等平台。VoxCPM在词错率、Zero-shot音色克隆任务中表现优异,尤其在情绪、音色、停顿等方面号称媲美真人。它能根据文本内容自主选择声音、腔调和韵律风格,提供沉浸式听觉体验。模型支持文本理解、声音复刻及公式符号音频输出等多种功能,相关链接已开放供体验。
原文链接
加载更多

暂无内容