VoxCPM - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

面壁智能 VoxCPM 1.5 语音生成 AI 模型开源：高采样音频克隆，生成效率翻倍

12月10日，面壁智能发布语音生成AI模型VoxCPM 1.5版本，并正式开源。该模型具备0.5B参数，支持高采样音频克隆，采样率从16kHz提升至44.1kHz，克隆效果更精细。新版本生成效率翻倍，仅需6.25个token即可生成1秒音频，同时优化了长文本音频的稳定性和质量。此外，新增LoRA和全量微调脚本，方便开发者深度定制。VoxCPM 1.5已在Github和Hugging Face平台开源，为开发者提供更强技术支持和灵活应用能力。

原文链接

梦境编程师

12-10 17:04:00

VoxCPM 1.5

生成效率

高采样音频克隆

分享至

打开微信扫一扫

内容投诉

生成图片

面壁智能发布语音生成基座“小钢炮”模型 VoxCPM：0.5B 参数号称媲美真人

9月18日，面壁智能发布语音生成基座模型VoxCPM，参数规模为0.5B。该模型由面壁智能与清华大学深圳国际研究生院联合研发，具备合成语音自然度、音色相似度及韵律表现力的SOTA水平，已开源至GitHub、Hugging Face等平台。VoxCPM在词错率、Zero-shot音色克隆任务中表现优异，尤其在情绪、音色、停顿等方面号称媲美真人。它能根据文本内容自主选择声音、腔调和韵律风格，提供沉浸式听觉体验。模型支持文本理解、声音复刻及公式符号音频输出等多种功能，相关链接已开放供体验。

原文链接