6月17日凌晨,上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口,推理输出可达8万Token,且强化训练成本仅53万美金,远低于行业平均水平。该模型定价分三个档位,前两档低于DeepSeek-R1,128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%,其新算法CISPO使强化学习阶段仅用512块H800 GPU,三周完成训练。此举标志着MiniMax加入大模型竞争,同时开启“开源周”,未来四天将发布更多技术更新。目前,DeepSeek R2的发布时间仍未确定,对行业格局带来不确定性。
原文链接
本文链接:https://kx.umi6.com/article/20355.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI CEO山姆·奥特曼:DeepSeek并未影响GPT的增长 将推更好的开源模型
2025-04-14 13:33:39
“大模型六虎”阶跃星辰3月将开源图生视频模型,并成立新的生态基金
2025-02-22 00:01:30
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
426 文章
79883 浏览
24小时热文
更多

-
2025-07-19 12:53:03
-
2025-07-19 12:51:53
-
2025-07-19 11:52:20