1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月26日,谷歌推出开源框架LMEval,旨在解决AI模型评测难题。LMEval为大语言模型和多模态模型提供标准化评测工具,统一API、数据格式和基准设置,大幅简化跨模型比较流程。它兼容Google、OpenAI、Anthropic等多个平台接口,支持文本、图像、代码等多领域基准测试,并能识别模型规避策略。此外,LMEval具备增量评估功能,采用多线程引擎优化效率,降低评测成本与时间。谷歌还推出可视化工具LMEvalboard,用雷达图直观展示模型表现差异。测试结果存储于本地SQLite数据库,兼顾隐私与便捷性。

原文链接
本文链接:https://kx.umi6.com/article/19310.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌:电网用电需求高时将削减AI数据中心用电
2025-08-05 15:22:58
消息称谷歌正打破 TPU 完全自托管局面,强化与英伟达 AI 芯片竞争
2025-09-04 09:58:59
Windsurf惊魂96小时!AI闪电并购战:谷歌天价挖人,Cognition逆袭接盘
2025-07-22 15:35:57
谷歌牵头推AI代理支付协议
2025-09-17 20:39:13
谷歌推出LLM评估新范式Game Arena
2025-08-05 15:21:53
谷歌未来两年将在美投资 250 亿美元,用于 AI 数据中心建设
2025-07-16 16:05:14
美国最大出版商 CEO 怒怼谷歌:用同一爬虫偷内容喂 AI,我们还不好屏蔽
2025-09-14 16:41:18
谷歌在 AI 生成的搜索答案旁塞入广告,监管已关注
2025-09-11 22:02:20
谷歌发布低成本订阅方案“AI Plus”:面向印尼等市场,每月仅需约 4.6 美元
2025-09-10 17:41:30
谷歌重塑物理 AI 智能体:赋予机器人“大脑和身体”,让其学会“先思考,后行动”
2025-09-26 16:32:23
新一轮AI浏览器大战,谷歌将掉队了?
2025-09-05 10:20:22
谷歌以47美分价格向美政府提供AI服务
2025-08-22 10:52:42
谷歌正式发布 Gemma 3n 小钢炮模型:2GB 内存本地玩转 AI 多模态
2025-06-27 16:11:19
24小时热文
更多
扫一扫体验小程序