北京时间2月18日,马斯克与xAI团队发布了Grok3,该模型在数学、科学与编程基准测试上超越主流模型。然而,在测试中,Grok3未能正确回答基础问题如“9.11与9.9哪个大”,显示出其在常识理解和实际应用中的局限。马斯克表示Grok3将用于火星任务,并预测三年内可能实现诺贝尔奖级别突破。但实际测试显示,Grok3的表现仅比R1或o1-Pro略好,且存在数据错误。xAI为展示优势采用了某些技巧,如PPT作图。Grok3的训练耗费了20万张H100显卡,耗时两亿小时,但效果提升有限。专家认为,单纯增加参数量已显现边际效应,未来AI发展需寻找新路径。
原文链接
本文链接:https://kx.umi6.com/article/13840.html
转载请注明文章出处
相关推荐
换一换
OpenAI 想赢的不是下一次发布会,而是下一代入口
2025-12-19 21:10:33
智谱冲击中国 AI 第一股,CEO 张鹏称模型销售年经常性收入已超 1 亿元
2025-12-02 19:30:45
全球首款:浙大一院、阿里达摩院发布主动脉急诊 AI 模型,快速识别“最凶险胸痛”
2025-08-27 17:05:25
Hugging Face 联合创始人沃尔夫:当前的 AI 模型不太可能带来重大科学突破
2025-10-02 16:17:29
Anthropic 性价比最高 AI 模型:Haiku 4.5 登场,1/3 价格实现 Sonnet 4 同级编程能力
2025-10-16 07:47:06
真格基金戴雨森 2025 AI 中场万字复盘
2025-07-29 10:28:18
奥尔特曼即将推出新模型“Shallotpeat”,承认谷歌威胁到 OpenAI
2025-11-24 17:06:52
研究称 AI 模型或将形成自己的“生存驱动力”,避免被人类关闭命运
2025-10-27 08:48:45
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
谷歌发布 Gemini 2.5 Computer Use 模型:专攻浏览器交互,支持 13 种操作
2025-10-09 09:08:03
亚马逊云科技发布 Nova 2 系列 AI 模型,同步推出 Nova Forge 定制服务
2025-12-03 09:12:53
716 文章
563869 浏览
24小时热文
更多
-
2026-04-24 09:05:36 -
2026-04-24 09:04:28 -
2026-04-24 09:03:22