2025-06-17 17:28:14
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
阅读:2072
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
原文链接
本文链接:https://kx.umi6.com/article/20326.html
转载请注明文章出处
相关推荐
.png)
换一换
Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
2025-06-10 18:53:38
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
2025-05-30 11:50:26
京东云开源JoyAgent智能体
2025-07-26 10:36:52
揭秘:OpenAI是如何发展出推理模型的?
2025-08-04 18:05:57
给Manus七分钟,它可以做什么
2025-05-19 22:24:28
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
小米首个推理大模型开源
2025-04-30 20:36:34
MiniMax正暗戳戳憋大招
2025-06-02 07:30:05
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
2025-05-20 18:43:16
501 文章
164940 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24