北京时间2月18日,马斯克与xAI团队发布了Grok3,该模型在数学、科学与编程基准测试上超越主流模型。然而,在测试中,Grok3未能正确回答基础问题如“9.11与9.9哪个大”,显示出其在常识理解和实际应用中的局限。马斯克表示Grok3将用于火星任务,并预测三年内可能实现诺贝尔奖级别突破。但实际测试显示,Grok3的表现仅比R1或o1-Pro略好,且存在数据错误。xAI为展示优势采用了某些技巧,如PPT作图。Grok3的训练耗费了20万张H100显卡,耗时两亿小时,但效果提升有限。专家认为,单纯增加参数量已显现边际效应,未来AI发展需寻找新路径。
原文链接
本文链接:https://kx.umi6.com/article/13840.html
转载请注明文章出处
相关推荐
换一换
最新研究:AI已经能在几分钟内通过CFA最难级别考试
2025-09-24 22:51:32
百万小时以上地球物理数据训练 AI模型超越当前地球系统预报水平
2025-05-22 08:25:08
全球首款:浙大一院、阿里达摩院发布主动脉急诊 AI 模型,快速识别“最凶险胸痛”
2025-08-27 17:05:25
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
2025-06-21 09:07:40
3 张照片 → 全景 3D:苹果携手推出革命性 AI 模型 Matrix3D,简化 3D 重建过程
2025-05-14 09:08:04
OpenAI 发现 AI 模型隐藏特征:可调控“毒性”行为,助力开发更安全 AI
2025-06-19 09:49:12
Meta据悉将推迟发布旗舰AI模型“巨兽”
2025-05-16 17:05:45
AGI又进一步了?谷歌AI模型重磅更新 助机器人感知环境完成复杂任务
2025-09-26 11:34:30
谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI
2025-05-21 15:08:05
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025-09-01 16:20:02
Meta 澄清:未使用用户未发布的照片训练 AI 模型
2025-06-29 22:34:20
马斯克发布Grok 4,年费飚到2万+
2025-07-10 19:26:08
真格基金戴雨森 2025 AI 中场万字复盘
2025-07-29 10:28:18
562 文章
260690 浏览
24小时热文
更多
-
2025-10-24 08:30:42 -
2025-10-24 08:29:28 -
2025-10-24 08:28:19