面壁智能于8月7日宣布开源MiniCPM-V 2.6模型,该模型在端侧AI多模态能力上声称已达到与GPT-4V相匹敌的水平。MiniCPM-V 2.6在参数量仅为8B的情况下,取得了20B以下的单图、多图、视频理解的顶尖成绩。其核心亮点包括: 1. **端侧多模态融合**:首次在端侧实现了单图、多图、视频理解等多模态能力,超越了GPT-4V,与Gemini 1.5 Pro和GPT-4o mini并驾齐驱。 2. **功能拓展至端侧**:引入了实时视频理解、多图联合理解、多图视觉类比学习、多图OCR等创新功能。 3. **高密度编码技术**:在单token编码像素密度上,相较于GPT-4o,实现了两倍的提升。 4. **优化端侧体验**:量化后的模型仅需6GB内存即可运行,端侧推理速度提升33%,并支持llama.cpp、ollama、vllm等多种推理方式,兼容多种语言。 5. **统一高效框架**:OCR能力继承了小钢炮系列的优秀传统,同时扩展到了单图、多图、视频理解领域。 此模型的开源,为AI领域带来了新的突破,有望推动端侧AI多模态技术的发展,促进相关应用的创新与普及。感兴趣的开发者和研究者可访问GitHub或HuggingFace平台获取更多信息及源代码。
原文链接
本文链接:https://kx.umi6.com/article/4683.html
转载请注明文章出处
相关推荐
.png)
换一换
面壁智能开源 MiniCPM-V 2.6 模型:号称端侧 AI 多模态能力对标 GPT-4V,6G 内存可用
2024-08-07 12:28:53
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
2024-08-07 11:18:02
纽约联储调查:人工智能应用加速扩张,但目前对就业影响有限
2025-09-05 00:10:35
国内首个AI计算开放架构发布
2025-09-06 14:35:37
中国电科王平:国内半导体装备已进入“战国时代”
2025-09-05 21:27:41
OpenAI今年预计通过ChatGPT实现近100亿美元收入,机构称GPT-5将给硬件和应用端这些企业带来机遇
2025-09-06 16:37:17
不寒而栗!AI克隆盗用别人声音 去卖不可描述保健品
2025-09-05 17:23:07
商汤大装置与华为昇腾 384 超节点全面适配,多项创新提升训练效率
2025-09-06 14:35:21
估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元
2025-09-05 12:18:29
腾讯大笔资金加码AI 曝一业务关停 相关视频号已被注销 官网显示“当前服务升级维护中”
2025-09-05 12:21:09
一个能让iPhone 用上AI 的配件,1300万人围观,但我觉得大可不必
2025-09-07 12:45:35
一场会议聊透具身智能:模型、数据、场景,我们梳理出了关键洞察
2025-09-05 10:21:32
机构:ChatGPT在印度实现强劲增长 8月下载量达1020万次
2025-09-05 09:15:57
514 文章
184091 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25