1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月17日,MiniMax稀宇科技宣布推出全球首个开源大规模混合架构推理模型M1,参数量达456B,性能超越DeepSeek-R1。该模型具备100万上下文输入和8万Token推理输出能力,支持长上下文理解和深度推理。MiniMax表示,M1在复杂生产力场景中表现优异,接近海外顶尖模型且性价比最高。训练采用创新技术,仅用3周、512块H800 GPU完成,租赁成本53.47万美元,远低于预期。M1在多个评测集中表现出色,尤其在长上下文任务中排名全球第二。此外,MiniMax承诺提供免费使用及低成本API服务,后续还将发布更多更新。

原文链接
本文链接:https://kx.umi6.com/article/20326.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
法国人工智能公司Mistral发布首个推理模型 支持欧洲多种语言
2025-06-10 20:54:31
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
阿里开源视觉理解模型Qwen3-VL
2025-09-24 14:43:41
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
MiniMax开源首个推理模型M1
2025-06-17 10:22:32
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
三家混战,大模型重回2023
2025-08-03 11:35:50
24小时热文
更多
扫一扫体验小程序