6月17日,人工智能公司Minimax宣布开源其首个推理模型M1。该模型采用了创新的Lightning Attention机制和混合注意力架构,能够支持高达100万token的上下文输入以及最多8万token的输出。性能上,M1在进行8万Token深度推理时仅需DeepSeek R1约30%的算力。据透露,模型强化学习阶段仅耗时三周,使用了512块H800显卡,总租赁成本为53.74万美元。作为业内领先的技术突破,M1的开源或将推动大模型领域的进一步发展。
原文链接
本文链接:https://kx.umi6.com/article/20298.html
转载请注明文章出处
相关推荐
.png)
换一换
Minimax创始人闫俊杰:保持专注,打好核心技术创新攻坚战| AI领先者心声・2025
2025-01-08 17:43:18
MiniMax 新股东曝光:新增“上海国资”,近 3 亿美元新融资基本完成
2025-07-14 23:29:14
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
2025-01-16 10:52:27
443 文章
64964 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13