12月10日,面壁智能发布语音生成AI模型VoxCPM 1.5版本,并正式开源。该模型具备0.5B参数,支持高采样音频克隆,采样率从16kHz提升至44.1kHz,克隆效果更精细。新版本生成效率翻倍,仅需6.25个token即可生成1秒音频,同时优化了长文本音频的稳定性和质量。此外,新增LoRA和全量微调脚本,方便开发者深度定制。VoxCPM 1.5已在Github和Hugging Face平台开源,为开发者提供更强技术支持和灵活应用能力。
原文链接
本文链接:https://kx.umi6.com/article/29991.html
转载请注明文章出处
相关推荐
换一换
面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍
2025-12-10 17:04:00
Meta可能在明年初推出新AI大模型Avocado
2025-12-09 22:02:45
卡塔尔成立国家人工智能公司Qai
2025-12-09 16:52:23
谷歌在印度推出Google AI Plus服务 月费399卢比
2025-12-10 14:54:26
2025年北交所市场的机构调研热情迎来大提升 机器人、低空经济、6G等受关注
2025-12-10 08:33:38
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
日产汽车与Wayve就驾驶辅助技术签署合作
2025-12-10 09:40:57
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地
2025-12-10 17:59:33
涨幅超过100%!内存条涨得比金条还快 年底可能更疯狂
2025-12-10 07:26:48
看完最新国产AI写的公众号文章 我慌了
2025-12-10 18:05:25
H200放行:英伟达6万亿市值路的「穿云箭」?
2025-12-10 14:53:20
全球缺电推动核能概念股爆发 基金经理看好涨势延至明年
2025-12-09 17:54:26
最高二手价1.6万、日租400元:“豆包”手机衍生新灰产
2025-12-10 19:03:55
639 文章
389029 浏览
24小时热文
更多
-
2025-12-10 19:06:09 -
2025-12-10 19:06:00 -
2025-12-10 19:05:04