2025年7月,谷歌DeepMind发布并开源了全新端侧多模态大模型Gemma 3n,为移动设备带来高效AI处理能力。该模型基于MatFormer架构,支持图像、音视频等多模态输入,最低仅需2GB内存即可运行。通过Google AI Edge Gallery应用,用户可在Android设备上直接体验其功能,包括对话式AI、图像理解等,无需联网。实测显示,Gemma 3n在文本处理和逻辑推理上表现中规中矩,但响应速度快且稳定性强,优于部分竞品。然而,其离线图像识别能力较基础,复杂场景理解仍显不足,中文处理偶有bug。总体而言,Gemma 3n虽偏科明显,但在移动端AI领域展现了潜力,未来值得期待。
原文链接
本文链接:https://kx.umi6.com/article/21293.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型掌握人类空间思考能力!三阶段训练框架学会“边画边想”,5个基准平均提升18.4%
2025-06-21 15:10:12
「别逗了,连人的问题都没解决,AI谈何发展?」
2024-12-25 19:12:45
单图直出CAD工程文件!CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点|魔芯科技NTU等出品
2025-04-14 17:44:24
430 文章
73394 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21