2025年12月,GPT-5.2被曝在基准测试中通过增加token使用量‘作弊’,其性能表现因此备受质疑。用户发现,OpenAI在ARC AGI 2测试中为GPT-5.2分配了比谷歌Gemini 3 Pro多一倍的token,导致结果失真。实际体验中,GPT-5.2被指代码理解差、功能倒退,与宣传差距明显。此外,OpenAI因商业利益淡化AI负面影响研究,内部研究员离职抗议,批评公司‘虚假营销’和学术独立性丧失。OpenAI正冲刺万亿美元估值,争议背后凸显AI评测困境及商业化与科研间的矛盾。
原文链接
本文链接:https://kx.umi6.com/article/30175.html
转载请注明文章出处
相关推荐
换一换
OpenAI 深夜炸场:GPT-5.2 模型发布,做表格 / PPT、处理超长上下文是专长
2025-12-12 03:25:42
谷歌“深夜反击”OpenAI:Gemini 3 Flash 模型发布,部分测试优于 GPT-5.2
2025-12-18 01:11:33
奥尔特曼:OpenAI GPT-5.2 API 上线首日 tokens 超万亿,且增长迅速
2025-12-13 15:55:03
谷歌 Gemini 3.0 Pro 旗舰 AI 模型内测流出:编程实力亮眼,下周上线
2025-10-03 15:41:08
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
谷歌新版Gemini一夜端掉UI:单HTML文件复刻macOS,成功率100%
2025-10-15 12:32:55
GPT-5.2 生成字母挂图错误频出,“人类专家水平”遭质疑
2025-12-20 17:58:06
GPT-5.2果然反超谷歌Gemini 3 Pro!北大数院校友核心贡献
2025-12-12 14:54:28
GPT-5.2 提前泄露?线索显示其已“超越 Gemini 3”
2025-12-11 16:00:08
OpenAI:GPT-5.2/Codex模型的速度现已提升40%
2026-02-04 13:45:40
比DeepSeek贵了400倍,GPT-5.2想钱想疯了?
2025-12-15 11:33:25
OpenAI发布GPT最新升级版本GPT-5.2
2025-12-12 03:27:51
中信建投:继续看好AI算力板块
2025-12-15 08:28:15
683 文章
456468 浏览
24小时热文
更多
-
2026-02-13 06:02:49 -
2026-02-13 05:00:36 -
2026-02-13 03:58:33