近日,号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理,尤其优化了欧洲语言的推理效果,并提升了可解释性,提供可追溯的思考过程。Magistral通过纯强化学习(RL)训练,采用改进的GRPO算法,在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small(24B参数)和面向企业的Magistral Medium版本。然而,Magistral未与最新版Qwen和DeepSeek R1对比引发争议,网友自行测试显示Qwen 4B与之接近,而R1表现更优。此外,有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式,但其透明度仍面临挑战。
原文链接
本文链接:https://kx.umi6.com/article/20052.html
转载请注明文章出处
相关推荐
.png)
换一换
LLM神话破灭?苹果论文最新实锤:难以实现真正智能
2025-06-09 20:34:34
消息称亚马逊正开发推理模型 Nova:又要快又要能深度思考
2025-03-04 19:27:39
Mistral AI发布人工智能助手APP
2025-02-07 10:57:47
智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
2025-03-31 10:26:26
新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面
2025-02-22 10:09:49
OpenAI 阿尔特曼:计划几周内推出 o3 mini 推理模型
2025-01-18 08:30:22
欧洲版 OpenAI CEO:开源模型没有任何风险,我只看到了好处
2024-08-07 13:19:19
网易有道推出推理模型“子曰-o1”并开源 支持消费级显卡
2025-01-22 10:57:36
OpenAI上架推理模型o3-mini 首次向免费用户开放推理功能
2025-02-01 05:13:09
Mistral AI新旗舰模型挑战Llama 3.1,1230亿参数性能直逼GPT-4o
2024-07-26 08:31:12
OpenAI o1 推理模型 API 上线,仅面向特定开发者开放
2024-12-18 07:21:36
MiniMax开源首个推理模型M1
2025-06-17 10:22:32
xAI推出Grok 4 Fast
2025-09-22 08:57:17
526 文章
255831 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12