谷歌DeepMind近期发布了一款名为Gemma 2的小模型,该模型参数量为2.6B,在LMSYS竞技场上的得分已超越了GPT-3.5和Mixtral 8x7B,展现出超越大模型的性能。在MMLU和MBPP基准测试中,Gemma 2分别取得了56.1和36.6的优异成绩,相比前代模型Gemma 1 2B,性能提升了10%。Gemma 2家族此次共发布了三个新成员:Gemma 2 2B、ShieldGemma和Gemma Scope。 Gemma 2 2B作为轻量级模型,在性能与效率之间实现了最佳平衡,其在设备上的表现令人印象深刻。在实际对话中,它甚至表现出超越参数量大两倍的流行模型的能力。此外,Gemma 2 2B可以在包括iPhone在内的多种终端设备上运行,展示了其出色的跨平台兼容性。 ShieldGemma作为一款安全内容分类器,旨在过滤AI模型的输入和输出,确保用户安全。它专注于检测和减少仇恨言论、骚扰内容、露骨内容及危险内容等四个关键领域,进一步提升了AI系统的安全性。 Gemma Scope则是一个开源稀疏自编码器集合,能够揭示AI决策过程,为研究人员提供前所未有的透明度。通过这些工具,AI社区可以构建更易理解、负责任和可靠的AI系统,从而推动AI技术的发展与应用。 整体来看,Gemma 2系列模型的发布不仅展示了小模型在性能上的巨大潜力,还通过引入安全分类器和可解释性工具,为AI领域的责任性和透明度带来了新的突破。
原文链接
本文链接:https://kx.umi6.com/article/4378.html
转载请注明文章出处
相关推荐
换一换
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模
2024-07-22 21:56:10
AI明星企业血战小模型,成本暴降还更省电费,加速AI普及
2024-07-22 22:17:53
小成本AI产品,也有春天
2024-06-26 19:03:41
2025 AI指数报告:没有一家独大,“小而美”大有可为
2025-04-17 14:39:15
谷歌发布开源模型Gemma 2,270亿参数奇袭Llama 3?
2024-06-28 09:35:15
Hugging Face 研究“AI 降本增效”:给予更长运算时间让低成本小模型输出比拟大模型准确结果
2024-12-29 16:56:31
苹果WWDC,AI小模型的批发时代
2024-06-17 11:24:38
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100或TPU主机可跑
2024-06-28 21:49:46
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
苹果看上的公司,靠量子「邪修」给模型瘦身
2025-09-02 18:36:33
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
OpenAI从微软挖来一员AI大将 或为公司开辟一条“小模型”赛道
2024-10-15 19:05:12
710 文章
569675 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38