6月17日凌晨,上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口,推理输出可达8万Token,且强化训练成本仅53万美金,远低于行业平均水平。该模型定价分三个档位,前两档低于DeepSeek-R1,128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%,其新算法CISPO使强化学习阶段仅用512块H800 GPU,三周完成训练。此举标志着MiniMax加入大模型竞争,同时开启“开源周”,未来四天将发布更多技术更新。目前,DeepSeek R2的发布时间仍未确定,对行业格局带来不确定性。
原文链接
本文链接:https://kx.umi6.com/article/20355.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
GRPO在《时空谜题》中击败o1、o3-mini和R1
2025-03-27 16:59:27
昆仑万维发布并开源 Skywork-R1V 3.0,多模态推理能力逼近人类专家水平
2025-07-09 11:04:18
匆匆发布的Llama4
2025-04-06 16:09:03
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
上海AI公司开源模型登上全球第二
2025-07-03 07:50:43
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
威胁还是机遇?DeepSeek的崛起对全球AI芯片行业影响几何
2025-02-07 18:06:02
超越 OpenAI 医疗能力全球登顶,百川发布开源 AI 大模型 Baichuan-M2
2025-08-11 14:01:35
Meta发布最强开源Llama 4,超越DeepSeek V3
2025-04-06 10:58:02
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
2025-07-07 17:32:00
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
475 文章
175424 浏览
24小时热文
更多

-
2025-09-06 22:39:24
-
2025-09-06 21:38:26
-
2025-09-06 20:38:03