近日,号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理,尤其优化了欧洲语言的推理效果,并提升了可解释性,提供可追溯的思考过程。Magistral通过纯强化学习(RL)训练,采用改进的GRPO算法,在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small(24B参数)和面向企业的Magistral Medium版本。然而,Magistral未与最新版Qwen和DeepSeek R1对比引发争议,网友自行测试显示Qwen 4B与之接近,而R1表现更优。此外,有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式,但其透明度仍面临挑战。
原文链接
本文链接:https://kx.umi6.com/article/20052.html
转载请注明文章出处
相关推荐
.png)
换一换
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
Mistral 发布首款多模态模型,挑战 OpenAI等竞争对手
2024-09-12 16:52:34
最强32B中文推理大模型易主:开源免费商用,1/20 DeepSeek-R1参数量SOTA,权重代码数据集全开源
2025-04-13 21:56:24
409 文章
58163 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13