全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
国产AI MiniCPM-o 2.6因仅8B参数便具备多模态能力而火爆海外。该模型可在iPad上运行,支持听觉、视觉和语言多模态交互。
MiniCPM-o 2.6能精准识别声音、图像和视频,如盲听各种声音、记忆卡片图案、理解图片内容及指导操作等。它还能模仿不同角色说话,如新闻主播、学生等,甚至带有印度口音。
MiniCPM-o 2.6在评测中与GPT-4o比肩,甚至在某些项目中超越。其核心技术是端到端全模态架构,结合了文本、图像、音频的编码和解码模块,实现高效流式处理。
面壁智能致力于在端侧设备上实现快速、高效、低耗的AI应用。MiniCPM-o 2.6展示了强大的多模态处理能力和声音自定义功能,适用于多种应用场景,包括视障人士出行辅助。
面壁智能CEO李大海强调,AI原生应用需结合AI原生硬件,端侧大模型至关重要。面壁智能的端侧模型已完全开源,MiniCPM-o 2.6在GitHub和Hugging Face上提供免费试用。
原文链接
本文链接:https://kx.umi6.com/article/11787.html
转载请注明文章出处
相关推荐
换一换
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
用编程大模型登顶开源第一后,智谱GLM团队被拷问了3小时
2025-12-25 11:29:48
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
小米开源首个原生端到端语音大模型
2025-09-19 10:10:03
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
2025-08-05 19:18:01
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
2025-08-01 09:07:26
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
从Figma到中国垂类应用全球崛起
2025-08-01 14:01:49
李飞飞团队推出首款商用世界模型Marble
2025-11-13 17:12:35
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
609 文章
409506 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55