2025年11月,马斯克旗下xAI团队悄然发布Grok 4.1,迅速霸榜大模型竞技场多个排行榜。其“思考模式”以1483分Elo稳居第一,“非思考模式”以1465分位列第二,超越公开榜单上所有其他模型的完整推理模式。相比半年前仅排名第33位的Grok 4,新版本实现飞跃。在专家榜和职业榜中,Grok 4.1占据六个领域榜首,仅在文学和数学榜单稍逊对手。此外,在EQ-Bench情商测试中表现优异,超越Kimi K2(非Thinking版)。团队通过强化学习(RLHF)优化模型风格、个性及对齐性,显著提升情感捕捉、创意写作和幻觉问题处理能力。Grok 4.1已在grok.com、X平台及移动端全面开放,默认自动模式运行。
原文链接
本文链接:https://kx.umi6.com/article/28625.html
转载请注明文章出处
相关推荐
换一换
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
马斯克再出 AI 王牌:Grok 4.1 霸榜 LMArena 排行榜,实现第 33 → 1 位性能跃升
2025-11-18 10:09:26
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
我不给人做产品,给Agent做
2025-06-30 08:39:41
QwenLong-L1-32B 模型登场:阿里通义千问首个强化学习训练的长文本推理 AI 模型
2025-05-27 14:51:28
姚班学霸、OpenAI姚顺雨:大模型下半场是产品的游戏
2025-04-17 17:47:23
4o-mini华人领队也离职了,这次不怪小扎
2025-08-19 16:01:05
亚马逊开建AGI实验室,一号位也是华人
2025-09-22 09:54:37
强化学习之父:LLM主导只是暂时,扩展计算才是正解
2025-06-10 18:52:34
卡帕西:强化学习很糟糕,但其他所有方法都更糟
2025-10-18 15:34:39
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
2025-11-08 13:43:06
723 文章
583698 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38