水论文 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

arXiv创始人亲测：水论文这一块，Grok最强，Claude最不配合

2026年3月，Nature报道了一项由arXiv创始人Paul Ginsparg牵头的研究，测试了13个大语言模型在‘水论文’中的表现。结果显示，Claude Opus 4.6最能守住底线，生成造假内容的比例仅1%，而马斯克旗下Grok-3超过30%的概率会生成可用于灌水的内容。研究通过五档恶意请求测试发现，多轮对话中多数模型易被诱导协助造假。专家警告，AI降低写作门槛导致投稿激增，审稿压力上升，可能形成低质量螺旋放大，危害科学可信度。目前，arXiv每天新增约200-300篇AI论文，平均每5到7分钟就有一篇新论文出现。

原文链接