近日,号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理,尤其优化了欧洲语言的推理效果,并提升了可解释性,提供可追溯的思考过程。Magistral通过纯强化学习(RL)训练,采用改进的GRPO算法,在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small(24B参数)和面向企业的Magistral Medium版本。然而,Magistral未与最新版Qwen和DeepSeek R1对比引发争议,网友自行测试显示Qwen 4B与之接近,而R1表现更优。此外,有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式,但其透明度仍面临挑战。
原文链接
本文链接:https://kx.umi6.com/article/20052.html
转载请注明文章出处
相关推荐
换一换
ASML 官宣同 Mistral AI 达成战略合作伙伴关系,并向后者投资 13 亿欧元
2025-09-09 14:16:53
英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理
2025-07-20 20:07:36
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
2025-06-11 09:04:46
阿里Qwen团队发布新推模型QwQ 会展示完整的思维链
2025-02-25 12:56:25
网易有道推出推理模型“子曰-o1”并开源 支持消费级显卡
2025-01-22 10:57:36
MiniMax正暗戳戳憋大招
2025-06-02 07:30:05
美团发布高效推理模型 LongCat-Flash-Thinking,达到 SOTA 水平
2025-09-22 15:58:35
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
DeepSeek小心,帝国反击战打响了
2025-02-26 22:53:26
谷歌发布新一代推理模型Gemini2.5:单次可处理百万token
2025-03-26 11:51:49
估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元
2025-09-05 12:18:29
推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
2024-11-20 23:21:18
财跃星辰CTO白祚:推理模型将快速迭代到Agent模型
2025-02-23 19:04:12
657 文章
527907 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38