6月7日消息,面壁智能于6日晚发布端侧大模型MiniCPM 4.0。该系列包括8B和0.5B两种参数规模,其中8B版本采用“高效双频换挡”机制,可根据任务特征自动切换注意力模式,优化长、短文本处理效率;0.5B版本则被称为“轻巧灵动的最强小小钢炮”。MiniCPM 4.0基于自研CPM.cu推理框架,支持在vLLM、SGLang、LlamaFactory等框架部署,极限场景下提速达220倍,常规场景下提速5倍。此外,官方强调其模型压缩量化创新及端侧部署优化,可实现90%的瘦身与速度提升,旨在提供流畅的端侧推理体验。
原文链接
本文链接:https://kx.umi6.com/article/19851.html
转载请注明文章出处
相关推荐
换一换
“一次开发,跨芯运行”:众智FlagOS与面壁智能联手,破解 AI大模型跨芯适配难题
2026-02-06 14:53:32
OpenAI错过的7个月,智能体2.0借终端爆发?
2024-11-05 16:01:00
【IT之家评测室】讯飞输入法 14.0 体验:端侧 AI 大模型加持,重构输入体验
2024-10-25 22:01:40
面壁智能发布语音生成基座“小钢炮”模型 VoxCPM:0.5B 参数号称媲美真人
2025-09-18 17:56:18
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
面壁智能 MiniCPM 4 与 Intel 全面适配,实现 AI PC 2.2 倍长文本推理优化
2025-06-13 00:40:15
树莓派上流畅运行大模型!让终端具备自主学习与记忆能力|对话RockAI CEO刘凡平
2025-04-27 16:19:13
北京国资出手 面壁智能年内再融数亿 端侧大模型已落地汽车、手机等领域
2025-10-11 10:35:31
面壁智能 MiniCPM 4 与 Intel 全面适配,实现 AI PC 2.2 倍长文本推理优化
2025-06-13 00:40:15
清华系初创面壁智能获新一轮数亿元融资
2024-12-11 09:17:12
国产大模型被抄袭事件告终 斯坦福团队致歉并撤下模型 面壁:知错能改,善莫大焉
2024-06-06 15:59:35
谷歌Gemma 3n实测
2025-07-07 11:27:31
面壁智能获新一轮数亿元融资,引领端侧大模型高效发展与应用普及
2025-05-21 09:57:36
692 文章
549339 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38