AI圈顶级榜单曝黑幕，Meta作弊刷分实锤？

2025-05-01 16:33:33

量子思考者

发布在

快讯

阅读：1389

近日，AI大模型排行榜LMArena被曝出可能存在作弊刷分行为，多家机构联合发表论文指控少数大厂利用漏洞操纵排名。论文指出，Meta等公司在测试阶段筛选最优模型，导致排行榜结果失真。OpenAI创始人Andrej Karpathy也分享个人体验，质疑某些模型排名与其实际表现不符。LMArena回应称论文存在事实错误，强调其政策公开透明，并反对将预发布模型纳入排名。事件引发对榜单公信力的广泛讨论，有人建议转向新平台OpenRouterAI，以更真实反映模型性能。LMArena由高校学生发起，初衷虽佳，但随着管理权交接，透明性和公平性受到挑战。此事件发生在LMArena筹备融资之际，可能对其未来发展产生影响。

原文链接

本文链接：https://kx.umi6.com/article/18076.html

转载请注明文章出处

LMArena