MiniMax开源4M超长上下文新模型,性能媲美DeepSeek-v3、GPT-4o。
西风 发自 凹非寺
量子位 | 公众号 QbitAI
开源模型上下文窗口扩展至超长,达400万token!
MiniMax开源最新模型——MiniMax-01系列,包含MiniMax-Text-01(基础语言模型)和MiniMax-VL-01(视觉多模态模型)。MiniMax-01首次大规模使用Lightning Attention架构,替代传统Transformer架构,使模型高效处理4M token上下文。
在基准测试中,MiniMax-01性能与顶级闭源模型相当。MiniMax-Text-01在处理超过20万token的上下文时优势明显。预填充延迟方面,MiniMax-01表现优异,延迟更低。
MiniMax-Text-01参数456B,采用混合架构,结合Lightning Attention、Softmax Attention及Mixture-of-Experts(MoE),训练上下文长度达100万token,推理时扩展至400万token。
MiniMax-Text-01在Core Academic Benchmark和LongBench v2、Ruler基准测试中表现出色,尤其在长上下文理解能力上超越多数模型。MiniMax-VL-01采用“ViT-MLP-LLM”框架,具备动态分辨率功能,训练数据丰富,表现突出。
MiniMax-01现已在Hailuo AI上部署,可免费试用,API价格分别为输入每百万token0.2美元,输出每百万token1.1美元。
原文链接
本文链接:https://kx.umi6.com/article/11694.html
转载请注明文章出处
相关推荐
换一换
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-08-25 21:34:29
OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望
2025-05-16 13:50:56
OpenAI 深夜炸场:GPT-5.2 模型发布,做表格 / PPT、处理超长上下文是专长
2025-12-12 03:25:42
小米大模型MiMo-V2-Pro发布
2026-03-19 07:35:44
英伟达新GPU,超长上下文/视频生成专用
2025-09-14 14:42:14
独家丨MiniMax 高级研究总监钟怡然已于半年前离职
2025-10-28 19:03:55
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
2024-11-19 13:44:15
Nature封面:机器人乒乓球干翻人类职业选手
2026-04-23 15:11:01
香港科创标杆奖项!商汤首席科学家林达华荣获中银香港科创奖
2026-04-22 18:21:40
谷歌:目前谷歌所有新代码中 75%由人工智能生成
2026-04-22 20:28:17
广东:加快人工智能在自动驾驶、智能座舱等领域应用 推动整车企业积极按程序争取L3级自动驾驶车型准入和上路通行试点
2026-04-22 17:24:40
天孚通信:1.6T光引擎处于量产状态目前因为个别物料缺料尚未达到预期产量 公司在积极协调供应商努力争取更多交付
2026-04-22 19:25:59
广东:运用人工智能技术优化芯片设计、制造全流程
2026-04-22 17:29:07
728 文章
590824 浏览
24小时热文
更多
-
2026-04-24 13:09:49 -
2026-04-24 12:12:33 -
2026-04-24 12:11:28