6月7日消息,面壁智能于6日晚发布端侧大模型MiniCPM 4.0。该系列包括8B和0.5B两种参数规模,其中8B版本采用“高效双频换挡”机制,可根据任务特征自动切换注意力模式,优化长、短文本处理效率;0.5B版本则被称为“轻巧灵动的最强小小钢炮”。MiniCPM 4.0基于自研CPM.cu推理框架,支持在vLLM、SGLang、LlamaFactory等框架部署,极限场景下提速达220倍,常规场景下提速5倍。此外,官方强调其模型压缩量化创新及端侧部署优化,可实现90%的瘦身与速度提升,旨在提供流畅的端侧推理体验。
原文链接
本文链接:https://kx.umi6.com/article/19851.html
转载请注明文章出处
相关推荐
换一换
OpenAI错过的7个月,智能体2.0借终端爆发?
2024-11-05 16:01:00
荣耀CEO赵明:功耗是端侧大模型亟待解决的问题
2024-05-28 18:22:27
清华系初创面壁智能获新一轮数亿元融资
2024-12-11 09:17:12
【IT之家评测室】讯飞输入法 14.0 体验:端侧 AI 大模型加持,重构输入体验
2024-10-25 22:01:40
留给“端侧大模型”的时间不多了
2024-06-04 15:06:31
深圳:加快发展端侧大模型 积极招引大模型厂商来深发展
2025-03-03 14:27:04
谷歌Gemma 3n实测
2025-07-07 11:27:31
“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型
2024-09-06 09:41:32
北京国资出手 面壁智能年内再融数亿 端侧大模型已落地汽车、手机等领域
2025-10-11 10:35:31
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
面壁智能完成新一轮数亿元融资 洪泰基金、国中资本、茅台基金等出资
2025-05-21 07:58:41
钛媒体独家
2024-12-11 08:15:47
智能车速度刷新:仅10个月,首个纯端侧大模型上车量产!
2025-04-24 18:41:45
588 文章
327712 浏览
24小时热文
更多
-
2025-12-08 17:39:25 -
2025-12-08 17:37:43 -
2025-12-08 16:38:29