2025-06-17 17:28:14
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
阅读:2298
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
原文链接
本文链接:https://kx.umi6.com/article/20326.html
转载请注明文章出处
相关推荐
换一换
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
AI 推理性能大提升:华为 UCM 技术开源,系统吞吐猛增 22 倍
2025-11-05 18:16:46
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
马斯克背叛理想
2025-08-24 22:18:31
智谱 GLM-4.7-Flash 模型发布并开源,可免费调用
2026-01-20 09:47:20
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
马斯克罕见低头:开源????推荐算法,自嘲“很烂”不过未来月更
2026-01-21 13:07:44
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
688 文章
486333 浏览
24小时热文
更多
-
2026-03-10 12:13:43 -
2026-03-10 11:10:02 -
2026-03-10 11:09:29