2025-06-17 17:28:14
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
阅读:2440
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
原文链接
本文链接:https://kx.umi6.com/article/20326.html
转载请注明文章出处
相关推荐
换一换
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
三部门:开展智能体与开源芯片、开源操作系统、开源大模型兼容适配
2026-05-08 18:36:29
商汤科技发布并开源日日新SenseNova U1
2026-04-28 21:39:58
开源炸场!优必选具身智能大模型Thinker再次狂揽9项全球第一!
2026-02-02 11:31:14
特斯拉开源硬件,中国公司回应来了:直接把机器人大脑开源了
2026-04-23 09:57:38
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
腾讯宣布企业微信正式开源CLI AI可调用日程、文档等7大能力
2026-03-30 10:41:47
智谱开源GLM-OCR模型
2026-02-03 09:27:36
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
AI助手OpenClaw爆火:一个24小时不休息的数字管家
2026-02-01 00:05:18
全球首个医疗视频理解大模型开源!6k+组精标测试集与英雄榜同步上线,开发者速来!
2026-04-26 14:16:11
756 文章
684697 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08