正文:11月17日,JetBrains发布业界首个开放式AI编码智能体基准测试平台DPAI Arena,并计划将其献给Linux Foundation。该平台支持多语言、多框架和多工作流,旨在衡量AI工具在现实软件工程任务中的效率,如bug修复、测试生成等。其灵活架构可实现公平且可重现的比较。平台首发基准Spring Benchmark引入数据集创建准则与评估规则,支持用户自定义数据集(BYOD)。JetBrains正与Spring AI Bench团队合作扩展Java基准测试流,推动多路径基准发展。未来,Linux Foundation将组建技术指导委员会,主导平台发展方向。
原文链接
本文链接:https://kx.umi6.com/article/28539.html
转载请注明文章出处
相关推荐
换一换
JetBrains 为开发者打造最强 AI 助手 Mellum:为编程而生,延迟低、补全快、准确度高
2024-10-23 10:32:17
业界首个,JetBrains 发布 AI 编码智能体基准测试平台 DPAI Arena
2025-11-17 12:23:53
Cursor 推出网页应用,用户可通过浏览器管理 AI 编码智能体网络
2025-07-01 16:27:10
阿里云和JetBrains合作推出基于通义大模型的AI Assistant
2024-09-20 21:02:43
JetBrains 旗下 AI Assistant 应用获更新,支持开发者接入本地 DeepSeek 等大语言模型
2025-02-17 15:51:20
超过三分之二的投资管理机构将AI广泛应用于前台业务支持
2026-01-21 19:23:09
NVIDIA黄仁勋:未来的电脑比现在强10亿倍
2026-01-21 23:29:50
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
融捷股份等成立新公司 含多项AI业务
2026-01-22 15:00:25
下载超 10 亿、衍生模型破 20 万,阿里千问刷新全球开源模型纪录
2026-01-21 16:18:32
阿里云智能集团资深副总裁李飞飞:内存价格预计还会上涨两到三倍
2026-01-22 19:09:39
千问系列模型下载量突破10亿次
2026-01-21 12:07:14
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
2026-01-22 20:08:53
641 文章
415989 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26