AI模型评测 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

谷歌发布开源 LMEval 框架：打破 AI 模型比较壁垒，降低评测成本和时间

5月26日，谷歌推出开源框架LMEval，旨在解决AI模型评测难题。LMEval为大语言模型和多模态模型提供标准化评测工具，统一API、数据格式和基准设置，大幅简化跨模型比较流程。它兼容Google、OpenAI、Anthropic等多个平台接口，支持文本、图像、代码等多领域基准测试，并能识别模型规避策略。此外，LMEval具备增量评估功能，采用多线程引擎优化效率，降低评测成本与时间。谷歌还推出可视化工具LMEvalboard，用雷达图直观展示模型表现差异。测试结果存储于本地SQLite数据库，兼顾隐私与便捷性。

原文链接