1月16日,面壁智能发布MiniCPM-o 2.6端侧全模态模型,参数为8B,号称性能比肩GPT-4o、Claude-3.5-Sonnet。该模型支持文本、图像、音频和视频等多种数据处理,可在iPad上运行,且在OpenCompass榜单上平均得分70.2,超越了GPT-4o-202405、Gemini 1.5 Pro和Claude 3.5 Sonnet等主流模型。MiniCPM-o 2.6还支持中英双语语音对话及情感控制等功能。
原文链接
本文链接:https://kx.umi6.com/article/11788.html
转载请注明文章出处
相关推荐
换一换
百度:推出首个多模态高度融合数字人
2025-06-17 16:25:35
Gemini 2.0来了:一个要做所有AI agent底座的超级模型
2024-12-12 14:55:24
谷歌Gemma 3n实测
2025-07-07 11:27:31
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
2024-11-19 14:45:41
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
2025-05-08 20:39:27
GPT-5来了!人人都能免费用,最强大模型只需最傻瓜式使用
2025-08-08 04:01:37
首个可保留情感的音频 LLM:Meta 重磅开源 7B-Spirit LM,一网打尽“音频 + 文本”多模态任务
2024-11-22 14:06:22
大模型热度退潮,真正的技术创新者开始被「看见」
2025-06-20 17:06:44
从Figma到中国垂类应用全球崛起
2025-08-01 14:01:49
字节跳动提出OmniHuman多模态框架 一张图配上音频即可生成逼真视频
2025-02-06 15:36:01
多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力!北大港科大出品,已开源
2025-02-06 09:24:07
实测字节扣子空间:AI 播客比真人丝滑,Agent 能打 80% 的工
2025-05-30 15:54:58
微软开源多模态 AI Agent“Magma”:购物时可自动下单,还能推测视频人物行为
2025-02-26 10:28:10
595 文章
283864 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50