稀宇科技(MiniMax)于1月15日发布并开源了新一代MiniMax 01系列模型,包括MiniMax-Text-01和MiniMax-VL-01。该系列模型首次大规模采用线性注意力机制,突破了Transformer架构的记忆限制,能够处理400万token的输入,是GPT-4o的32倍。MiniMax 01系列模型参数量达4560亿,性能可媲美GPT-4o-1120及Claude-3.5-Sonnet-1022。在长文本任务上,MiniMax-Text-01表现出色,性能衰减更少。该系列模型的定价为输入1元/百万token,输出8元/百万token。
原文链接
本文链接:https://kx.umi6.com/article/11700.html
转载请注明文章出处
相关推荐
换一换
滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型
2025-01-28 11:43:35
MiniMax刘华:Agent将成为近期模型的主战场
2025-02-22 15:43:54
AI预测论文能不能中,8B超越70B大模型,港大发布图文融合多智能体GraphAgent
2025-01-15 16:34:03
MiniMax正式发布通用智能体产品
2025-06-19 17:53:56
我MiniMax,用实习生处理数据,照样屠榜开源大模型
2025-11-04 14:15:32
字节、腾讯、阿里,AI 编码「三国杀」
2025-07-25 15:26:00
MiniMax刘华:底层模型决定产品的上限
2025-02-22 15:41:48
迪士尼环球华纳齐告MiniMax,AI版权问题又添新官司
2025-09-18 08:49:51
大模型独角兽公司MiniMax最新估值超40亿美元 知情人士:公司正寻求A股上市
2025-07-16 16:08:02
DeepSeek的“服务器繁忙”让所有人抓狂,背后究竟是怎么回事
2025-02-13 10:59:42
蚂蚁武威:下一代「推理」模型范式大猜想
2025-05-21 00:47:21
MiniMax将收购深圳AI视频生成创企鹿影科技
2025-03-14 09:01:19
泡沫与洼地:重估中国AI
2025-11-18 18:30:42
581 文章
341204 浏览
24小时热文
更多
-
2025-12-18 01:11:33 -
2025-12-18 00:10:29 -
2025-12-18 00:09:16