MiniMax 推出全球首个开源大规模混合架构的推理模型 M1：456B 参数，性能超 DeepSeek-R1

2025-06-17 17:28:14

星际Code流浪者

发布在

快讯

阅读：2544

6月17日，MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1，参数量达456B，性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力，支持长上下文理解和深度推理。MiniMax表示，M1在复杂生产力场景中表现优异，接近海外顶尖模型且性价比最高。训练采用创新技术，仅用3周、512块H800 GPU完成，租赁成本53.47万美元，远低于预期。M1在多个评测集中表现出色，尤其在长上下文任务中排名全球第二。此外，MiniMax承诺提供免费使用及低成本API服务，后续还将发布更多更新。

原文链接

本文链接：https://kx.umi6.com/article/20326.html

转载请注明文章出处

MiniMax-M1