1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

MiniMax开源4M超长上下文新模型,性能媲美DeepSeek-v3、GPT-4o。

西风 发自 凹非寺

量子位 | 公众号 QbitAI

开源模型上下文窗口扩展至超长,达400万token!

MiniMax开源最新模型——MiniMax-01系列,包含MiniMax-Text-01(基础语言模型)和MiniMax-VL-01(视觉多模态模型)。MiniMax-01首次大规模使用Lightning Attention架构,替代传统Transformer架构,使模型高效处理4M token上下文。

在基准测试中,MiniMax-01性能与顶级闭源模型相当。MiniMax-Text-01在处理超过20万token的上下文时优势明显。预填充延迟方面,MiniMax-01表现优异,延迟更低。

MiniMax-Text-01参数456B,采用混合架构,结合Lightning Attention、Softmax Attention及Mixture-of-Experts(MoE),训练上下文长度达100万token,推理时扩展至400万token。

MiniMax-Text-01在Core Academic Benchmark和LongBench v2、Ruler基准测试中表现出色,尤其在长上下文理解能力上超越多数模型。MiniMax-VL-01采用“ViT-MLP-LLM”框架,具备动态分辨率功能,训练数据丰富,表现突出。

MiniMax-01现已在Hailuo AI上部署,可免费试用,API价格分别为输入每百万token0.2美元,输出每百万token1.1美元。

原文链接
本文链接:https://kx.umi6.com/article/11694.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o
2025-01-15 13:29:41
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-08-25 21:34:29
OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望
2025-05-16 13:50:56
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
2024-11-19 13:44:15
智谱推出“Claude API 用户特别搬家计划”:替换 API URL 即可无缝切换
2025-09-05 18:22:23
OpenAI杀入招聘市场:打造AI技能认证体系+人才对接平台
2025-09-05 06:12:15
智谱打响中场战事
2025-09-06 06:30:37
通义千问系列最强大的语言模型:Qwen3-Max-Preview 上线
2025-09-06 00:26:52
估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元
2025-09-05 12:18:29
瑞银:中国AI变现取得进展 芯片本土化进程加速
2025-09-04 18:08:20
DeepSeek被曝开发AI智能体模型:能自主完成多步工作
2025-09-05 08:15:12
OpenAI 不想再「跪着」买显卡了
2025-09-05 18:24:42
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
24小时热文
更多
扫一扫体验小程序