全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
国产AI MiniCPM-o 2.6因仅8B参数便具备多模态能力而火爆海外。该模型可在iPad上运行,支持听觉、视觉和语言多模态交互。
MiniCPM-o 2.6能精准识别声音、图像和视频,如盲听各种声音、记忆卡片图案、理解图片内容及指导操作等。它还能模仿不同角色说话,如新闻主播、学生等,甚至带有印度口音。
MiniCPM-o 2.6在评测中与GPT-4o比肩,甚至在某些项目中超越。其核心技术是端到端全模态架构,结合了文本、图像、音频的编码和解码模块,实现高效流式处理。
面壁智能致力于在端侧设备上实现快速、高效、低耗的AI应用。MiniCPM-o 2.6展示了强大的多模态处理能力和声音自定义功能,适用于多种应用场景,包括视障人士出行辅助。
面壁智能CEO李大海强调,AI原生应用需结合AI原生硬件,端侧大模型至关重要。面壁智能的端侧模型已完全开源,MiniCPM-o 2.6在GitHub和Hugging Face上提供免费试用。
原文链接
本文链接:https://kx.umi6.com/article/11787.html
转载请注明文章出处
相关推荐
.png)
换一换
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
2025-04-28 12:48:54
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
2025-05-09 12:47:33
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
416 文章
75616 浏览
24小时热文
更多

-
2025-07-20 13:03:48
-
2025-07-20 12:02:31
-
2025-07-20 10:03:13