6月17日,MiniMax发布全球首个开源大规模混合架构推理模型M1,创始人闫俊杰称‘大山不是不能翻越’。M1通过闪电注意力机制和强化学习算法CISPO实现高效推理,仅用512块H800三周完成训练。随后4天内,公司连续推出视频生成模型、智能体等多款产品。资本市场方面,MiniMax被曝正考虑港股IPO,此前已积累十几亿美元现金储备,近期完成Pre-IPO融资。公司成立于2022年,专注MoE架构研发,曾将80%算力投入此技术路线。尽管其M1模型未引发轰动,业内对其探索路径评价积极。面对DeepSeek竞争,MiniMax坚持自研底层模型,海外应用则选择接入DeepSeek。
原文链接
本文链接:https://kx.umi6.com/article/21586.html
转载请注明文章出处
相关推荐
.png)
换一换
MiniMax开源首个推理模型M1
2025-06-17 10:22:32
国内首个,MiniMax 大模型通过人机辩论图灵测试
2025-07-29 19:34:03
国地中心、MiniMAX、上海仪电、阶跃星辰等签约产业联合体
2025-02-22 15:40:46
腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.1
2024-11-07 10:16:21
DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP
2025-02-25 11:53:00
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
2025-05-20 14:38:41
MiniMax没有B计划
2025-04-10 22:14:41
MiniMax刘华:Agent将成为近期模型的主战场
2025-02-22 15:43:54
大模型独角兽公司MiniMax最新估值超40亿美元 知情人士:公司正寻求A股上市
2025-07-16 16:08:02
AI创业进入“淘汰赛” MiniMax洽谈收购视频生成创企鹿影科技
2025-03-14 13:10:40
MiniMax 新股东曝光:新增“上海国资”,近 3 亿美元新融资基本完成
2025-07-14 23:29:14
DeepSeek扔的第二枚开源王炸到底是什么?
2025-02-25 20:07:11
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
2025-05-19 14:16:37
580 文章
286217 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12