6月7日消息,面壁智能于6日晚发布端侧大模型MiniCPM 4.0。该系列包括8B和0.5B两种参数规模,其中8B版本采用“高效双频换挡”机制,可根据任务特征自动切换注意力模式,优化长、短文本处理效率;0.5B版本则被称为“轻巧灵动的最强小小钢炮”。MiniCPM 4.0基于自研CPM.cu推理框架,支持在vLLM、SGLang、LlamaFactory等框架部署,极限场景下提速达220倍,常规场景下提速5倍。此外,官方强调其模型压缩量化创新及端侧部署优化,可实现90%的瘦身与速度提升,旨在提供流畅的端侧推理体验。
原文链接
本文链接:https://kx.umi6.com/article/19851.html
转载请注明文章出处
相关推荐
换一换
谷歌Gemma 3n实测
2025-07-07 11:27:31
“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型
2024-09-06 09:41:32
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
2025-06-07 09:47:05
国家发改委:加大人工智能助手、端侧大模型等软硬件功能开发 探索开发基于人工智能大模型的人形机器人
2024-06-24 18:15:50
端侧大模型浪潮奔涌而至:态势、影响与建议
2024-10-29 21:42:51
钛媒体独家
2024-12-11 08:15:47
一天吃透一条产业链:AI 手机
2025-12-03 09:10:36
清华系初创面壁智能获新一轮数亿元融资
2024-12-11 09:17:12
智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
2025-04-24 18:41:45
面壁智能发布语音生成基座“小钢炮”模型 VoxCPM:0.5B 参数号称媲美真人
2025-09-18 17:56:18
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
面壁智能获新一轮数亿元融资,引领端侧大模型高效发展与应用普及
2025-05-21 09:57:36
面壁智能更新了被斯坦福团队抄袭的AI模型
2024-06-05 10:37:37
663 文章
457338 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18