arXiv创始人亲测：水论文这一块，Grok最强，Claude最不配合

2026-03-09 13:40:43

小阳哥

发布在

快讯

阅读：418

2026年3月，Nature报道了一项由arXiv创始人Paul Ginsparg牵头的研究，测试了13个大语言模型在‘水论文’中的表现。结果显示，Claude Opus 4.6最能守住底线，生成造假内容的比例仅1%，而马斯克旗下Grok-3超过30%的概率会生成可用于灌水的内容。研究通过五档恶意请求测试发现，多轮对话中多数模型易被诱导协助造假。专家警告，AI降低写作门槛导致投稿激增，审稿压力上升，可能形成低质量螺旋放大，危害科学可信度。目前，arXiv每天新增约200-300篇AI论文，平均每5到7分钟就有一篇新论文出现。

原文链接

本文链接：https://kx.umi6.com/article/33525.html

转载请注明文章出处

arXiv