6月17日凌晨,上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口,推理输出可达8万Token,且强化训练成本仅53万美金,远低于行业平均水平。该模型定价分三个档位,前两档低于DeepSeek-R1,128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%,其新算法CISPO使强化学习阶段仅用512块H800 GPU,三周完成训练。此举标志着MiniMax加入大模型竞争,同时开启“开源周”,未来四天将发布更多技术更新。目前,DeepSeek R2的发布时间仍未确定,对行业格局带来不确定性。
原文链接
本文链接:https://kx.umi6.com/article/20355.html
转载请注明文章出处
相关推荐
换一换
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
2025-06-27 15:12:57
字节突然开源Seed-OSS,512K上下文主流4倍长度,推理能力刷纪录
2025-08-21 14:33:12
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
最强Coding Plan上线!阿里云上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型
2026-02-25 13:16:58
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
消息称智谱 GLM-4.5 今晚开源新模型,知情人士回应确有其事
2025-07-28 16:20:04
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
OpenAI开源两款gpt-oss系列推理大模型 能力接近o3和o4-mini
2025-08-06 11:30:27
智谱发布新一代旗舰开源模型 GLM-4.5,专为智能体应用打造
2025-07-28 22:20:02
阿里开源4款Qwen3.5小尺寸模型,马斯克点赞:惊人的智能水平
2026-03-03 11:53:36
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
2026-02-14 16:26:42
664 文章
477592 浏览
24小时热文
更多
-
2026-03-10 09:02:22 -
2026-03-10 09:01:12 -
2026-03-10 09:00:02