5月26日,谷歌推出开源框架LMEval,旨在解决AI模型评测难题。LMEval为大语言模型和多模态模型提供标准化评测工具,统一API、数据格式和基准设置,大幅简化跨模型比较流程。它兼容Google、OpenAI、Anthropic等多个平台接口,支持文本、图像、代码等多领域基准测试,并能识别模型规避策略。此外,LMEval具备增量评估功能,采用多线程引擎优化效率,降低评测成本与时间。谷歌还推出可视化工具LMEvalboard,用雷达图直观展示模型表现差异。测试结果存储于本地SQLite数据库,兼顾隐私与便捷性。
原文链接
本文链接:https://kx.umi6.com/article/19310.html
转载请注明文章出处
相关推荐
换一换
谷歌推出托管 MCP 服务器,让 AI 智能体可直接接入其工具
2025-12-11 07:32:48
谷歌:美国电力传输系统是连接数据中心的最大挑战,等接入电网要等十年多
2026-01-15 13:37:35
初创公司入局浏览器领域挑战谷歌 互联网入口之争全面升级
2026-01-05 20:26:16
从 AI 潜在牺牲品到赢家,谷歌在 ChatGPT 冲击下逆袭
2025-11-25 00:21:57
垂直整合程度最高的AI大厂!“新王”谷歌登基:整个硅谷都在颤抖?
2025-11-25 11:48:38
谷歌在印度推出Google AI Plus服务 月费399卢比
2025-12-10 14:54:26
奥特曼承认谷歌威胁到OpenAI!即将推出新模型“Shallotpeat”
2025-11-24 16:04:37
景林最新美股持仓:谷歌升至第一大重仓 高位减持英伟达
2026-02-07 04:35:20
因 AI 生成大量未经许可的经典卡通形象,迪士尼指控谷歌大规模侵犯版权
2025-12-12 00:19:08
谷歌Nano Banana Pro亮相:打工人的“图像生成神器”来了!
2025-11-21 01:54:12
谷歌重申暂无在 Gemini 中投放广告计划,聚焦搜索广告
2026-01-18 22:45:31
美股开盘涨跌不一 英伟达跌超4%
2025-11-25 23:13:08
谷歌:大哥也疯狂,翻倍豪赌AI
2026-02-06 03:23:18
660 文章
487301 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43