2025年11月,马斯克旗下xAI团队悄然发布Grok 4.1,迅速霸榜大模型竞技场多个排行榜。其“思考模式”以1483分Elo稳居第一,“非思考模式”以1465分位列第二,超越公开榜单上所有其他模型的完整推理模式。相比半年前仅排名第33位的Grok 4,新版本实现飞跃。在专家榜和职业榜中,Grok 4.1占据六个领域榜首,仅在文学和数学榜单稍逊对手。此外,在EQ-Bench情商测试中表现优异,超越Kimi K2(非Thinking版)。团队通过强化学习(RLHF)优化模型风格、个性及对齐性,显著提升情感捕捉、创意写作和幻觉问题处理能力。Grok 4.1已在grok.com、X平台及移动端全面开放,默认自动模式运行。
原文链接
本文链接:https://kx.umi6.com/article/28625.html
转载请注明文章出处
相关推荐
换一换
机器狗能打羽毛球:仅靠强化学习从 0 自学,还会自己移步
2025-05-30 17:53:28
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
2025-05-30 16:56:50
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
2025-03-17 12:34:27
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
上海 AI 实验室联合清华等大学突破强化学习算法,攻克 AI 推理熵崩溃难题
2025-06-04 08:15:30
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
2025-10-30 10:33:49
DeepSeek首登《自然》封面:中国大模型创造新历史,做了OpenAI不敢做的事
2025-09-18 16:58:59
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
641 文章
405561 浏览
24小时热文
更多
-
2026-01-10 18:28:15 -
2026-01-10 18:27:08 -
2026-01-10 17:27:50