
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,谷歌DeepMind发布并开源了全新端侧多模态大模型Gemma 3n,为移动设备带来高效AI处理能力。该模型基于MatFormer架构,支持图像、音视频等多模态输入,最低仅需2GB内存即可运行。通过Google AI Edge Gallery应用,用户可在Android设备上直接体验其功能,包括对话式AI、图像理解等,无需联网。实测显示,Gemma 3n在文本处理和逻辑推理上表现中规中矩,但响应速度快且稳定性强,优于部分竞品。然而,其离线图像识别能力较基础,复杂场景理解仍显不足,中文处理偶有bug。总体而言,Gemma 3n虽偏科明显,但在移动端AI领域展现了潜力,未来值得期待。
原文链接
2025年6月27日,谷歌在I/O开发者大会预览后正式发布Gemma 3n端侧多模态模型,支持在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频等多种数据类型。该模型分为E2B(50亿参数)和E4B(80亿参数)两个版本,可在2GB或3GB内存设备上运行,内存占用相当于20亿和40亿模型。其采用创新的MatFormer架构和MobileNet-v5视觉编码器,提升计算灵活性和效率。Gemma 3n支持140种语言的文本和35种语言的多模态理解,在数学、编码和推理方面表现优异,E4B模型更是首个参数量低于10B但LMArena得分超1300的模型。
原文链接
加载更多

暂无内容