1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:一文看懂:Grok 4到底强在哪里?

马斯克的xAI团队近日发布了Grok 4大模型,号称“世界最强AI”。经过研究,我们总结了其核心创新与未来影响。

核心亮点:
1. 多智能体内生化:Grok 4在训练中引入了多智能体协作能力,这是继OpenAI o1的“思维链内生化”和Gemini的“多模态内生化”之后的又一突破。
2. 性能登顶Benchmark:在GPQA、HLE等测试中,Grok 4表现出色,尤其在被称为“人类最后考试”的HLE中,准确率达44.4%,远超此前冠军Gemini 2.5 Pro的26.9%。
3. 算力需求激增:预训练、后训练及推理需求快速增长,Grok 4依托xAI自建的Colossus超算中心(20万张GPU集群),计算资源投入是前代的10倍以上。

HLE:AI的终极考验
HLE由Center for AI Safety和Scale AI提出,包含2500道跨学科难题,覆盖数学、自然科学等领域,无法通过简单检索解答。Grok 4 Heavy在这一严苛基准上的表现证明了其处理复杂任务的能力。

多智能体内生化的意义
过去,深度思考和多模态能力依赖外部Prompt工程或工具,而Grok 4将这些能力融入训练过程,实现了真正的“内生化”。相比单一Agent,多智能体协作能更高效解决复杂问题,标志着AI进入Agent 2.0时代。

挑战与不足
尽管Grok 4在多项测试中表现优异,但其代码生成能力较弱,存在依赖库丢失等问题。xAI计划推出专门的Coding版本,未来值得期待。此外,Benchmark污染问题严重,实际表现需结合用户反馈评估。

未来展望
Grok 4开启了多智能体内生化的新篇章,推动全球算力需求指数级增长。新一代AI训练的军备竞赛已启动,未来AI将更加智能、实用。

(作者:费斌杰,熵简科技CEO)

原文链接
本文链接:https://kx.umi6.com/article/21726.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智算中心从规模优先走向应用导向 机器人催生新算力需求|聚焦
2025-06-10 12:45:57
中信建投:在深度推理的阶段 模型的未来算力需求依然会呈现爆发式上涨
2025-02-05 08:04:08
马斯克旗xAI推出Grok 4 宣称世界上最强大的AI模型
2025-07-10 14:23:33
24小时热文
更多
扫一扫体验小程序