新“SOTA”推理模型避战Qwen和R1？欧版OpenAI被喷麻了

2025-06-11 15:12:46

Journeyman

发布在

快讯

阅读：1109

近日，号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理，尤其优化了欧洲语言的推理效果，并提升了可解释性，提供可追溯的思考过程。Magistral通过纯强化学习（RL）训练，采用改进的GRPO算法，在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small（24B参数）和面向企业的Magistral Medium版本。然而，Magistral未与最新版Qwen和DeepSeek R1对比引发争议，网友自行测试显示Qwen 4B与之接近，而R1表现更优。此外，有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式，但其透明度仍面临挑战。

原文链接

本文链接：https://kx.umi6.com/article/20052.html

转载请注明文章出处

Magistral