1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

面壁科技发布MiniCPM-V 2.6,这款端侧大模型在多模态核心能力上实现了对GPT-4V的全面超越,包括单图、多图及视频理解能力。MiniCPM-V 2.6在端侧性能上对标GPT-4V,取得了20B以下参数下的SOTA成绩。在知识密度上,得益于视觉token数量减少30%,MiniCPM-V 2.6的单token编码像素密度是GPT-4V的两倍。它还首次在端侧实现了实时视频理解、多图联合理解和多图ICL能力。量化后端侧内存仅需6GB,推理速度达18 tokens/s,相比上代模型快33%,并支持多种语言。MiniCPM-V 2.6在实时视频理解、多图联合理解和复杂推理能力上展现出强大性能,超越了GPT-4V。此外,它在单图理解、多图理解及视频理解上均取得SOTA成绩,知识压缩率高于GPT-4o。在OCRBench和Object HalBench评测中,MiniCPM-V 2.6在OCR性能和幻觉水平上表现出色,优于多个商用模型。面壁通过统一高清视觉架构,实现了多模态能力的共享和优化,使得MiniCPM-V 2.6在多个视觉理解场景中表现出色。

原文链接
本文链接:https://kx.umi6.com/article/4677.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%
2024-06-12 13:18:49
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
2025-04-04 13:13:45
多模态大模型不会画辅助线?最新评估得分:o3仅25.8%,远低于人类82.3% | 清华腾讯斯坦福联合
2025-05-28 16:33:14
全球首个多模态世界模型Emu3来了!智源王仲远:为多模态大模型训练范式指明新方向
2024-10-22 19:16:13
大模型如何避免“狭义AI陷阱”?
2024-07-15 21:50:24
万亿赛道的具身智能,到底是什么?
2025-03-24 20:14:12
字节迭代多模态大模型 媲美谷歌新品 智能体能力更强、推理成本更低
2025-05-13 15:57:01
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
2024-08-07 11:18:02
「生数科技」完成数亿元Pre-A轮融资,百度投了 | 36氪首发
2024-06-06 16:27:59
对话式AI即将爆发!将在手机助手、陪伴机器人、学习机等场景率先落地
2025-03-08 22:12:53
2025十大AI技术趋势:具身智能、世界模型都有望迎来ChatGPT时刻
2025-01-09 11:54:47
生数科技再获数亿元大额融资,Vidu领跑多模态大模型赛道
2025-09-19 11:12:21
商汤绝影行业首发原生多模态大模型车端部署:80 亿参数、每秒 40 Tokens
2024-07-19 13:35:17
24小时热文
更多
扫一扫体验小程序