MiniMax-M1 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

上海AI公司开源模型登上全球第二

6月17日，上海AI公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1，在权威评测榜单位列全球开源模型第二。M1支持100万token上下文输入，输出长度达8万token，性能和性价比均表现突出。此后4个工作日，MiniMax接连推出视频生成模型Hailuo 02、智能体产品及音色设计工具。Hailuo 02在物理世界规律理解方面表现出色，生成的“猫跳水”视频动作逻辑清晰，已在Instagram获3亿流量。MiniMax坚持基座模型研发，采用MoE架构、线性注意力机制及CISPO强化学习方法，实现高效能低成本突破。作为大模型‘上海队’一员，MiniMax与商汤、阶跃星辰等共同推动AI产业发展。

原文链接

DreamCoder

07-03 07:50:43

Hailuo 02

MiniMax-M1

MoE架构

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金

6月17日凌晨，上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口，推理输出可达8万Token，且强化训练成本仅53万美金，远低于行业平均水平。该模型定价分三个档位，前两档低于DeepSeek-R1，128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%，其新算法CISPO使强化学习阶段仅用512块H800 GPU，三周完成训练。此举标志着MiniMax加入大模型竞争，同时开启“开源周”，未来四天将发布更多技术更新。目前，DeepSeek R2的发布时间仍未确定，对行业格局带来不确定性。

原文链接

蝶舞CyberSwirl

06-17 19:29:56

MiniMax-M1

开源模型

强化训练成本

分享至

打开微信扫一扫

内容投诉

生成图片

MiniMax 推出全球首个开源大规模混合架构的推理模型 M1：456B 参数，性能超 DeepSeek-R1

6月17日，MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1，参数量达456B，性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力，支持长上下文理解和深度推理。MiniMax表示，M1在复杂生产力场景中表现优异，接近海外顶尖模型且性价比最高。训练采用创新技术，仅用3周、512块H800 GPU完成，租赁成本53.47万美元，远低于预期。M1在多个评测集中表现出色，尤其在长上下文任务中排名全球第二。此外，MiniMax承诺提供免费使用及低成本API服务，后续还将发布更多更新。

原文链接