1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

面壁科技发布MiniCPM-V 2.6,这款端侧大模型在多模态核心能力上实现了对GPT-4V的全面超越,包括单图、多图及视频理解能力。MiniCPM-V 2.6在端侧性能上对标GPT-4V,取得了20B以下参数下的SOTA成绩。在知识密度上,得益于视觉token数量减少30%,MiniCPM-V 2.6的单token编码像素密度是GPT-4V的两倍。它还首次在端侧实现了实时视频理解、多图联合理解和多图ICL能力。量化后端侧内存仅需6GB,推理速度达18 tokens/s,相比上代模型快33%,并支持多种语言。MiniCPM-V 2.6在实时视频理解、多图联合理解和复杂推理能力上展现出强大性能,超越了GPT-4V。此外,它在单图理解、多图理解及视频理解上均取得SOTA成绩,知识压缩率高于GPT-4o。在OCRBench和Object HalBench评测中,MiniCPM-V 2.6在OCR性能和幻觉水平上表现出色,优于多个商用模型。面壁通过统一高清视觉架构,实现了多模态能力的共享和优化,使得MiniCPM-V 2.6在多个视觉理解场景中表现出色。

原文链接
本文链接:https://kx.umi6.com/article/4677.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
上海人工智能实验室开源多模态大模型书生·万象3.0
2025-04-17 12:40:23
GPT-4o能拼好乐高吗?首个多步空间推理评测基准:闭源模型领跑
2025-04-23 11:52:51
智源王仲远:多模态大模型对产业更加重要,得多模态大模型得天下
2024-12-31 12:40:05
商汤绝影行业首发原生多模态大模型车端部署:80 亿参数、每秒 40 Tokens
2024-07-19 13:35:17
格灵深瞳:大模型是核心技术发展方向 何时扭亏成投资者关注话题|直击股东会
2024-08-21 10:32:00
独家对话Soul App CTO:看好多模态端到端大模型落地社交,新能力预计年底上线
2024-10-19 11:17:30
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
2024-08-07 11:18:02
阶跃星辰多模态大模型为OPPO新机提供技术支持
2025-04-22 16:25:15
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
2025-05-29 12:28:01
阶跃星辰联合吉利首次开源 Step 系列多模态大模型,包含视频、语音两款模型
2025-02-18 11:13:42
多模态通用感知能力超越 GPT-5,上海 AI 实验室开源书生・万象 3.5 大模型
2025-09-03 21:51:48
面壁智能开源 MiniCPM-V 2.6 模型:号称端侧 AI 多模态能力对标 GPT-4V,6G 内存可用
2024-08-07 12:28:53
GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
2025-04-04 13:10:23
24小时热文
更多
扫一扫体验小程序