2025年11月,马斯克旗下xAI团队悄然发布Grok 4.1,迅速霸榜大模型竞技场多个排行榜。其“思考模式”以1483分Elo稳居第一,“非思考模式”以1465分位列第二,超越公开榜单上所有其他模型的完整推理模式。相比半年前仅排名第33位的Grok 4,新版本实现飞跃。在专家榜和职业榜中,Grok 4.1占据六个领域榜首,仅在文学和数学榜单稍逊对手。此外,在EQ-Bench情商测试中表现优异,超越Kimi K2(非Thinking版)。团队通过强化学习(RLHF)优化模型风格、个性及对齐性,显著提升情感捕捉、创意写作和幻觉问题处理能力。Grok 4.1已在grok.com、X平台及移动端全面开放,默认自动模式运行。
原文链接
本文链接:https://kx.umi6.com/article/28625.html
转载请注明文章出处
相关推荐
换一换
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
2025-11-18 15:24:50
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
2025-07-24 16:09:58
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
全球闲置算力训个模型,性能媲美R1,老黄“天塌了”
2025-05-16 14:29:01
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
2025-07-11 11:34:40
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
688 文章
486202 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18