近日,号称‘欧洲的OpenAI’的Mistral AI发布了其首款推理模型Magistral。该模型支持多语言推理,尤其优化了欧洲语言的推理效果,并提升了可解释性,提供可追溯的思考过程。Magistral通过纯强化学习(RL)训练,采用改进的GRPO算法,在AIME-24数学测试中实现了从26.8%到73.6%的准确率提升。它分为开源的Magistral Small(24B参数)和面向企业的Magistral Medium版本。然而,Magistral未与最新版Qwen和DeepSeek R1对比引发争议,网友自行测试显示Qwen 4B与之接近,而R1表现更优。此外,有声音呼吁Mistral AI应更开源以巩固市场地位。Magistral的发布标志着LLM强化学习训练的新范式,但其透明度仍面临挑战。
原文链接
本文链接:https://kx.umi6.com/article/20052.html
转载请注明文章出处
相关推荐
换一换
研究人员开源 Sky-T1 推理 AI 模型,训练成本不到 450 美元
2025-01-12 17:55:27
OpenAI新推理模型被曝产生更多幻觉
2025-04-21 08:36:41
ASML 官宣同 Mistral AI 达成战略合作伙伴关系,并向后者投资 13 亿欧元
2025-09-09 14:16:53
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
网易有道推出推理模型“子曰-o1”并开源 支持消费级显卡
2025-01-22 10:57:36
武汉人工智能研究院院长王金桥:未来大模型战场将转向推理模型| AI领先者心声・2025
2025-01-06 16:36:35
阿里云通义发布首个多模态推理模型QVQ
2024-12-25 13:05:41
训练成本不到 50 美元,研究人员打造出媲美 OpenAI o1 的推理模型
2025-02-06 09:25:10
网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”
2025-01-22 11:53:44
英伟达突然开源新模型,直逼DeepSeek-R1成推理天花板
2025-04-09 13:50:12
腾讯混元全新推理模型 T1 官宣:3 月 21 日发布
2025-03-19 21:51:02
智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414
2025-03-31 10:26:26
光刻机巨头,为啥要投AI?
2025-09-27 15:44:12
678 文章
600152 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41