标题:马斯克的Grok-3,水平如何?
昨天,马斯克发布了备受期待的Grok-3。尽管国内自媒体纷纷吹捧,但我们需要客观分析其真实水平。
Grok-3尚未全面开放,现有评测有限。官方数据显示,Grok-3的性能仅比第二名的gemini-2.0高出1.4%。虽然Grok-2表现不佳,但Grok-3的提升幅度与投入的20万张GPU相比显得不足。
我们不能完全依赖官方数据。去年,一家中国AI公司也曾高分低能,最终被揭露为特定优化所致。
Andrej Karpathy的评测较为中肯。他认为Grok-3接近OpenAI最强模型的水平,但未展现出显著优势。他同时指出,模型具有随机性,需更多评估。
网友反馈显示,Grok-3编写代码能力尚待提高,有人质疑测试的公平性。
总体来看,Grok-3展示了潜力,但仍处于测试阶段,缺乏重大突破。尽管如此,OpenAI的领先地位正在受到挑战,未来竞争将更加激烈。
原文链接
本文链接:https://kx.umi6.com/article/13755.html
转载请注明文章出处
相关推荐
.png)
换一换
马斯克,有望成万亿美元巨富
2025-09-05 22:27:21
腾讯高管解读 Q2 财报:会继续加大 AI 投资
2025-08-13 23:43:40
Glean完成1.5亿美元F轮融资,威灵顿资产领投
2025-07-23 15:55:37
谷歌推出AI商务通话功能
2025-07-18 10:38:36
那天,AI大模型想起了,被「失忆」所束缚的枷锁
2025-09-01 16:21:15
马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用
2025-08-11 10:02:03
Figma上市飙涨:不是AI原生,却成了“天选之子”
2025-08-01 18:07:15
奥尔特曼:AI已能破解大多数身份验证方式
2025-07-23 15:57:48
开幕预告 | 双奖得主杰弗里辛顿领衔,全球AI群星在此闪耀!
2025-07-25 13:24:25
马斯克亲口证实xAI代码库被盗!涉案前员工被起诉,已跳槽OpenAI
2025-08-31 13:00:45
马斯克宣布 xAI 开源 Grok 2.5 模型,Grok 3 将在半年后跟进
2025-08-24 08:09:16
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
AI成“新业务基因”!腾讯半年净赚1034亿 Q2资本开支飙升119%
2025-08-13 22:42:51
486 文章
165766 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08