1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑

国产AI MiniCPM-o 2.6因仅8B参数便具备多模态能力而火爆海外。该模型可在iPad上运行,支持听觉、视觉和语言多模态交互。

MiniCPM-o 2.6能精准识别声音、图像和视频,如盲听各种声音、记忆卡片图案、理解图片内容及指导操作等。它还能模仿不同角色说话,如新闻主播、学生等,甚至带有印度口音。

MiniCPM-o 2.6在评测中与GPT-4o比肩,甚至在某些项目中超越。其核心技术是端到端全模态架构,结合了文本、图像、音频的编码和解码模块,实现高效流式处理。

面壁智能致力于在端侧设备上实现快速、高效、低耗的AI应用。MiniCPM-o 2.6展示了强大的多模态处理能力和声音自定义功能,适用于多种应用场景,包括视障人士出行辅助。

面壁智能CEO李大海强调,AI原生应用需结合AI原生硬件,端侧大模型至关重要。面壁智能的端侧模型已完全开源,MiniCPM-o 2.6在GitHub和Hugging Face上提供免费试用。

原文链接
本文链接:https://kx.umi6.com/article/11787.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
2025-04-28 12:48:54
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
2025-05-09 12:47:33
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
24小时热文
更多
扫一扫体验小程序