8月26日,面壁智能宣布开源8B参数的MiniCPM-V 4.5多模态模型,称其为“最强端侧多模态模型”。该模型在视频理解、图片识别、复杂文档解析等任务中表现卓越,尤其具备行业首个高刷视频理解能力,支持每秒处理更多帧数,大幅超越Qwen2.5-VL 72B等模型。MiniCPM-V 4.5通过3D-Resampler技术实现96倍视觉压缩率,显著提升动态画面理解精度。此外,其在MotionBench、OpenCompass等多项榜单中达到同级SOTA水平,并兼顾性能与响应速度,提供常规模式和深度思考模式。模型已开源,可通过Github、Hugging Face及ModelScope获取。
原文链接
本文链接:https://kx.umi6.com/article/24314.html
转载请注明文章出处
相关推荐
换一换
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
2024-11-11 16:27:28
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
多模态新旗舰MiniCPM-V 4.5:8B 性能超越 72B,高刷视频理解又准又快
2025-08-27 12:03:30
对话阶跃星辰CEO姜大昕:两年发布16款多模态模型,DeepSeek证明投流模式不成立
2025-05-08 16:31:26
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025-09-01 13:19:49
实测Gemini 3 Pro - ,未来已来?
2025-11-19 10:08:03
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
具身智能实力派!十年多模态打底,世界模型开路,商汤悟能来了
2025-07-28 10:08:25
智谱首个免费多模态模型 GLM-4V-Flash 上线,支持图像描述生成、视觉问答等
2024-12-09 22:35:42
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
阿里云栖大会一口气发布千问 3-VL、万相 2.5 等六大模型 + 通义百聆新品牌,覆盖文本、视觉、语音、视频、代码、图像全场景
2025-09-24 14:42:04
实测商汤实时音视频交互模型5o:“造假”齐白石《虾》一眼识破!
2025-01-23 16:19:50
609 文章
339781 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57