北京时间2月18日,马斯克与xAI团队发布了Grok3,该模型在数学、科学与编程基准测试上超越主流模型。然而,在测试中,Grok3未能正确回答基础问题如“9.11与9.9哪个大”,显示出其在常识理解和实际应用中的局限。马斯克表示Grok3将用于火星任务,并预测三年内可能实现诺贝尔奖级别突破。但实际测试显示,Grok3的表现仅比R1或o1-Pro略好,且存在数据错误。xAI为展示优势采用了某些技巧,如PPT作图。Grok3的训练耗费了20万张H100显卡,耗时两亿小时,但效果提升有限。专家认为,单纯增加参数量已显现边际效应,未来AI发展需寻找新路径。
原文链接
本文链接:https://kx.umi6.com/article/13840.html
转载请注明文章出处
相关推荐
换一换
超 98% 参赛者:OpenAI 神秘 AI 模型首次斩获信息学奥赛 IOI 2025 金牌
2025-08-12 11:19:59
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
成人内容提供商起诉 Meta:指控其利用盗版内容训练 AI 模型
2025-07-29 18:33:38
AGI又进一步了?谷歌AI模型重磅更新 助机器人感知环境完成复杂任务
2025-09-26 11:34:30
智谱冲击中国 AI 第一股,CEO 张鹏称模型销售年经常性收入已超 1 亿元
2025-12-02 19:30:45
谷歌 Gemini 3.0 Pro 旗舰 AI 模型内测流出:编程实力亮眼,下周上线
2025-10-03 15:41:08
宇树王兴兴:机器人性能已达标 AI模型称成最大瓶颈
2025-09-11 19:02:35
马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用
2025-08-11 10:02:03
骁龙X2 Elite NPU算力达80 TOPS 遥遥领先AMD/Intel!为何如此之高
2025-10-19 17:51:16
研究称 AI 模型或将形成自己的“生存驱动力”,避免被人类关闭命运
2025-10-27 08:48:45
这个AI精准模拟人类行为大脑状态,上Nature了
2025-07-15 17:48:52
资金算力决定论下的「1%」例外
2025-12-09 10:28:45
新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”
2025-11-08 10:35:27
652 文章
428303 浏览
24小时热文
更多
-
2026-01-23 12:56:24 -
2026-01-23 11:53:08 -
2026-01-23 11:52:03