1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,AI大模型排行榜LMArena被曝出可能存在作弊刷分行为,多家机构联合发表论文指控少数大厂利用漏洞操纵排名。论文指出,Meta等公司在测试阶段筛选最优模型,导致排行榜结果失真。OpenAI创始人Andrej Karpathy也分享个人体验,质疑某些模型排名与其实际表现不符。LMArena回应称论文存在事实错误,强调其政策公开透明,并反对将预发布模型纳入排名。事件引发对榜单公信力的广泛讨论,有人建议转向新平台OpenRouterAI,以更真实反映模型性能。LMArena由高校学生发起,初衷虽佳,但随着管理权交接,透明性和公平性受到挑战。此事件发生在LMArena筹备融资之际,可能对其未来发展产生影响。

原文链接
本文链接:https://kx.umi6.com/article/18076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
2025-03-04 14:11:50
马斯克再出 AI 王牌:Grok 4.1 霸榜 LMArena 排行榜,实现第 33 → 1 位性能跃升
2025-11-18 10:09:26
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
2025-05-30 16:55:41
Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜
2025-06-23 15:25:53
LMArena最新排名:文心大模型5.0 Preview文本能力位居国内第一
2025-12-23 23:02:32
AI竞技场,归根到底只是一门生意
2025-08-06 15:37:54
谷歌 Gemini 3.0 Pro 模型发布即登顶 LMArena,奥尔特曼、马斯克齐送贺电
2025-11-19 13:15:11
LMArena排行榜:Claude、GPT-5、智谱GLM-4.6排名并列全球第一
2025-11-13 21:22:57
全球AI产品再次洗牌,「中国制造」后来居上
2025-03-11 11:24:38
人工智能城市竞争力排行报告:厘清各城市AI家底,帮地方画出AI和产业结合图谱
2024-06-25 20:56:17
AI圈顶级榜单曝黑幕,Meta作弊刷分实锤?
2025-05-01 16:33:33
给AI打个分,结果搞出17亿估值独角兽???
2026-01-07 18:23:47
重思启动重塑,美通社成功举办2026新传播年度论坛
2026-01-22 13:58:50
24小时热文
更多
扫一扫体验小程序