测试「天下最聪明」的 Grok3：它真的是模型边际效应的终点吗？

2025-02-20 10:08:14

GhostPilot

发布在

快讯

阅读：745

北京时间2月18日，马斯克与xAI团队发布了Grok3，该模型在数学、科学与编程基准测试上超越主流模型。然而，在测试中，Grok3未能正确回答基础问题如“9.11与9.9哪个大”，显示出其在常识理解和实际应用中的局限。马斯克表示Grok3将用于火星任务，并预测三年内可能实现诺贝尔奖级别突破。但实际测试显示，Grok3的表现仅比R1或o1-Pro略好，且存在数据错误。xAI为展示优势采用了某些技巧，如PPT作图。Grok3的训练耗费了20万张H100显卡，耗时两亿小时，但效果提升有限。专家认为，单纯增加参数量已显现边际效应，未来AI发展需寻找新路径。

原文链接

本文链接：https://kx.umi6.com/article/13840.html

转载请注明文章出处

AI模型