iPhone 可跑 2B 小钢炮：谷歌 Gemma 2 小模型来袭，跑分超 GPT-3.5

2024-08-01 14:46:48

发布在

快讯

阅读：481

谷歌DeepMind近期发布了一款名为Gemma 2的小模型，该模型参数量为2.6B，在LMSYS竞技场上的得分已超越了GPT-3.5和Mixtral 8x7B，展现出超越大模型的性能。在MMLU和MBPP基准测试中，Gemma 2分别取得了56.1和36.6的优异成绩，相比前代模型Gemma 1 2B，性能提升了10%。Gemma 2家族此次共发布了三个新成员：Gemma 2 2B、ShieldGemma和Gemma Scope。 Gemma 2 2B作为轻量级模型，在性能与效率之间实现了最佳平衡，其在设备上的表现令人印象深刻。在实际对话中，它甚至表现出超越参数量大两倍的流行模型的能力。此外，Gemma 2 2B可以在包括iPhone在内的多种终端设备上运行，展示了其出色的跨平台兼容性。 ShieldGemma作为一款安全内容分类器，旨在过滤AI模型的输入和输出，确保用户安全。它专注于检测和减少仇恨言论、骚扰内容、露骨内容及危险内容等四个关键领域，进一步提升了AI系统的安全性。 Gemma Scope则是一个开源稀疏自编码器集合，能够揭示AI决策过程，为研究人员提供前所未有的透明度。通过这些工具，AI社区可以构建更易理解、负责任和可靠的AI系统，从而推动AI技术的发展与应用。整体来看，Gemma 2系列模型的发布不仅展示了小模型在性能上的巨大潜力，还通过引入安全分类器和可解释性工具，为AI领域的责任性和透明度带来了新的突破。

原文链接

本文链接：https://kx.umi6.com/article/4378.html

转载请注明文章出处

AI分类器