
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月17日,上海AI公司MiniMax发布全球首个开源大规模混合架构推理模型MiniMax-M1,在权威评测榜单位列全球开源模型第二。M1支持100万token上下文输入,输出长度达8万token,性能和性价比均表现突出。此后4个工作日,MiniMax接连推出视频生成模型Hailuo 02、智能体产品及音色设计工具。Hailuo 02在物理世界规律理解方面表现出色,生成的“猫跳水”视频动作逻辑清晰,已在Instagram获3亿流量。MiniMax坚持基座模型研发,采用MoE架构、线性注意力机制及CISPO强化学习方法,实现高效能低成本突破。作为大模型‘上海队’一员,MiniMax与商汤、阶跃星辰等共同推动AI产业发展。
原文链接
6月17日凌晨,上海AI独角兽MiniMax发布全球首个开源大规模混合架构推理模型M1。M1支持100万Token上下文窗口,推理输出可达8万Token,且强化训练成本仅53万美金,远低于行业平均水平。该模型定价分三个档位,前两档低于DeepSeek-R1,128k-1M Token档为行业空白。MiniMax称M1所需算力仅为DeepSeek R1的25%-30%,其新算法CISPO使强化学习阶段仅用512块H800 GPU,三周完成训练。此举标志着MiniMax加入大模型竞争,同时开启“开源周”,未来四天将发布更多技术更新。目前,DeepSeek R2的发布时间仍未确定,对行业格局带来不确定性。
原文链接
6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。
原文链接
加载更多

暂无内容