6月7日消息,面壁智能于6日晚发布端侧大模型MiniCPM 4.0。该系列包括8B和0.5B两种参数规模,其中8B版本采用“高效双频换挡”机制,可根据任务特征自动切换注意力模式,优化长、短文本处理效率;0.5B版本则被称为“轻巧灵动的最强小小钢炮”。MiniCPM 4.0基于自研CPM.cu推理框架,支持在vLLM、SGLang、LlamaFactory等框架部署,极限场景下提速达220倍,常规场景下提速5倍。此外,官方强调其模型压缩量化创新及端侧部署优化,可实现90%的瘦身与速度提升,旨在提供流畅的端侧推理体验。
原文链接
本文链接:https://kx.umi6.com/article/19851.html
转载请注明文章出处
相关推荐
换一换
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
2024-09-10 19:45:30
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型
2024-09-06 09:41:32
谷歌Gemma 3n实测
2025-07-07 11:27:31
智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
2025-04-24 18:41:45
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
面壁智能完成新一轮数亿元融资 洪泰基金、国中资本、茅台基金等出资
2025-05-21 07:58:41
面壁智能 MiniCPM 4 与 Intel 全面适配,实现 AI PC 2.2 倍长文本推理优化
2025-06-13 00:40:15
清华系初创面壁智能获新一轮数亿元融资
2024-12-11 09:17:12
留给“端侧大模型”的时间不多了
2024-06-04 15:06:31
北京国资出手 面壁智能年内再融数亿 端侧大模型已落地汽车、手机等领域
2025-10-11 10:35:31
国产大模型被抄袭事件告终 斯坦福团队致歉并撤下模型 面壁:知错能改,善莫大焉
2024-06-06 15:59:35
面壁智能发布端侧大模型“前进四”MiniCPM 4.0,号称性能大小王
2025-06-07 09:47:05
635 文章
398250 浏览
24小时热文
更多
-
2026-01-22 23:18:34 -
2026-01-22 23:17:29 -
2026-01-22 22:15:16