国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
近日,一段由国产免费2B开源语音模型生成的郭德纲经典贯口《莽撞人》引发关注。这一难度极高的段子曾是北影台词课教材,许多专业演员也难以驾驭。而这次,AI生成的女声版不仅节奏精准,还正确处理了“百(bē)战百(bē)胜”等特殊发音,甚至自带情感表现力。
不仅如此,该模型还能轻松复刻其他语言和方言。例如,它用东北话还原了“音乐会儿”“害有”等趣味词汇,并支持四川话版《大话西游》、韩语版《甄嬛传》等多语种演绎,覆盖九种方言和三十门外语,音质高达48000Hz(CD级)。
这款模型名为VoxCPM 2,由面壁智能联合OpenBMB开源社区与清华大学人机语音交互实验室共同开发。其核心技术采用扩散自回归连续表征,避免传统方案中的信息损失,从而保留原始声音的情感基调和方言特色。此外,模型基于MiniCPM基座打造,延续“小身板、大能量”的特点,仅2B大小却功能强大。
使用时,用户只需上传参考音频并输入文本,即可生成高表现力语音。例如,上传宋小宝原声片段后,可快速生成东北话版《火影忍者》台词,生成时间不到一秒。模型还支持降噪、情绪控制等功能,满足多样化需求。
目前,VoxCPM 2已开源,提供完整工具链,支持多种部署方式。体验地址:https://voxcpm.modelbest.cn/
原文链接
本文链接:https://kx.umi6.com/article/34546.html
转载请注明文章出处
相关推荐
换一换
Generalist最新长文定调:具身原生才是正道,原力灵机已交卷
2026-04-08 19:04:02
一夜之间 你的手机电脑要冒出无数bug了?
2026-04-09 00:37:16
阿里组织架构调整!升级通义大模型事业部 CTO集结成团
2026-04-08 19:05:10
AI尚未取代工程师!科技岗位今年暴涨:空缺超6.7万
2026-04-08 18:03:13
英特尔总市值突破3000亿美元 股价创5年新高
2026-04-09 22:30:18
Skill vs App:一场入口范式的争夺
2026-04-08 12:53:31
美银:预计到2030年 半导体市场规模达2万亿美元
2026-04-09 18:21:28
“10元基”阵营扩容 79只主动权益基金累计净值突破10元大关
2026-04-09 11:03:30
武大文科教授硬核跨界AI:半年项目量猛涨4000%,重构AI图表生产力
2026-04-08 23:32:29
DeepSeek专家模式上线!深度思考+极速Token 复杂难题一键搞定
2026-04-08 10:49:12
腾讯云:对AI算力、容器服务及弹性MapReduce(EMR)相关产品刊例价上调5%
2026-04-09 13:09:41
半导体掀全产业链涨价潮 行业从价格战转向利润修复
2026-04-08 08:43:38
Copilot命名泛滥:到底有多少微软都数不清!AI专家绘制出全家福
2026-04-07 18:11:31
665 文章
499512 浏览
24小时热文
更多
-
2026-04-09 22:30:18 -
2026-04-09 20:27:01 -
2026-04-09 20:25:55