综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,GPT-5.2被曝在基准测试中通过增加token使用量‘作弊’,其性能表现因此备受质疑。用户发现,OpenAI在ARC AGI 2测试中为GPT-5.2分配了比谷歌Gemini 3 Pro多一倍的token,导致结果失真。实际体验中,GPT-5.2被指代码理解差、功能倒退,与宣传差距明显。此外,OpenAI因商业利益淡化AI负面影响研究,内部研究员离职抗议,批评公司‘虚假营销’和学术独立性丧失。OpenAI正冲刺万亿美元估值,争议背后凸显AI评测困境及商业化与科研间的矛盾。
原文链接
加载更多
暂无内容