全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
国产AI MiniCPM-o 2.6因仅8B参数便具备多模态能力而火爆海外。该模型可在iPad上运行,支持听觉、视觉和语言多模态交互。
MiniCPM-o 2.6能精准识别声音、图像和视频,如盲听各种声音、记忆卡片图案、理解图片内容及指导操作等。它还能模仿不同角色说话,如新闻主播、学生等,甚至带有印度口音。
MiniCPM-o 2.6在评测中与GPT-4o比肩,甚至在某些项目中超越。其核心技术是端到端全模态架构,结合了文本、图像、音频的编码和解码模块,实现高效流式处理。
面壁智能致力于在端侧设备上实现快速、高效、低耗的AI应用。MiniCPM-o 2.6展示了强大的多模态处理能力和声音自定义功能,适用于多种应用场景,包括视障人士出行辅助。
面壁智能CEO李大海强调,AI原生应用需结合AI原生硬件,端侧大模型至关重要。面壁智能的端侧模型已完全开源,MiniCPM-o 2.6在GitHub和Hugging Face上提供免费试用。
原文链接
本文链接:https://kx.umi6.com/article/11787.html
转载请注明文章出处
相关推荐
.png)
换一换
MoE那么大,几段代码就能稳稳推理 | 开源
2025-07-02 18:09:04
豆包大模型1.6正式发布
2025-06-11 11:12:11
Meta 发布 Multi-SpatialMLLM:多模态 AI 突破空间理解瓶颈
2025-05-29 14:33:07
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
张鹏×潘乱×张一甲,对谈实录
2025-07-10 14:22:23
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
马斯克背叛理想
2025-08-24 22:18:31
462 文章
173337 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25