5月26日,谷歌推出开源框架LMEval,旨在解决AI模型评测难题。LMEval为大语言模型和多模态模型提供标准化评测工具,统一API、数据格式和基准设置,大幅简化跨模型比较流程。它兼容Google、OpenAI、Anthropic等多个平台接口,支持文本、图像、代码等多领域基准测试,并能识别模型规避策略。此外,LMEval具备增量评估功能,采用多线程引擎优化效率,降低评测成本与时间。谷歌还推出可视化工具LMEvalboard,用雷达图直观展示模型表现差异。测试结果存储于本地SQLite数据库,兼顾隐私与便捷性。
原文链接
本文链接:https://kx.umi6.com/article/19310.html
转载请注明文章出处
相关推荐
.png)
换一换
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
2025-04-18 08:01:29
谷歌 Veo 3 AI 文生视频模型正式向 Pro / Ultra 会员开放,后续将新增“照片生成视频”功能
2025-07-04 08:36:19
谷歌将视频生成AI模型Veo 2整合至Gemini
2025-04-16 15:10:35
409 文章
58508 浏览
24小时热文
更多

-
2025-07-22 00:23:59
-
2025-07-21 22:23:40
-
2025-07-21 21:25:24