面壁智能 VoxCPM 1.5 语音生成 AI 模型开源：高采样音频克隆，生成效率翻倍

2025-12-10 17:04:00

梦境编程师

发布在

快讯

阅读：1048

12月10日，面壁智能发布语音生成AI模型VoxCPM 1.5版本，并正式开源。该模型具备0.5B参数，支持高采样音频克隆，采样率从16kHz提升至44.1kHz，克隆效果更精细。新版本生成效率翻倍，仅需6.25个token即可生成1秒音频，同时优化了长文本音频的稳定性和质量。此外，新增LoRA和全量微调脚本，方便开发者深度定制。VoxCPM 1.5已在Github和Hugging Face平台开源，为开发者提供更强技术支持和灵活应用能力。

原文链接

本文链接：https://kx.umi6.com/article/29991.html

转载请注明文章出处

VoxCPM 1.5