1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年11月,马斯克旗下xAI团队悄然发布Grok 4.1,迅速霸榜大模型竞技场多个排行榜。其“思考模式”以1483分Elo稳居第一,“非思考模式”以1465分位列第二,超越公开榜单上所有其他模型的完整推理模式。相比半年前仅排名第33位的Grok 4,新版本实现飞跃。在专家榜和职业榜中,Grok 4.1占据六个领域榜首,仅在文学和数学榜单稍逊对手。此外,在EQ-Bench情商测试中表现优异,超越Kimi K2(非Thinking版)。团队通过强化学习(RLHF)优化模型风格、个性及对齐性,显著提升情感捕捉、创意写作和幻觉问题处理能力。Grok 4.1已在grok.com、X平台及移动端全面开放,默认自动模式运行。

原文链接
本文链接:https://kx.umi6.com/article/28625.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
2025-03-17 12:37:44
RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理
2025-04-23 11:57:26
发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
2025-09-09 18:18:27
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
强化学习之于 AI Agent,是灵魂、还是包袱?
2025-04-23 11:56:20
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
2025-08-11 10:59:04
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
无需外部数据!AI自问自答实现推理能力进化
2025-08-08 16:13:47
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
宇树和智元爆火背后:人类是如何给机器人注入灵魂的?
2025-03-14 09:00:17
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
马斯克再出 AI 王牌:Grok 4.1 霸榜 LMArena 排行榜,实现第 33 → 1 位性能跃升
2025-11-18 10:09:26
24小时热文
更多
扫一扫体验小程序