1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

MiniMax的好日子来了?

昨天凌晨,MiniMax正式开源了首个推理模型M1。尽管在基准测试中表现平平,但M1拥有业界最长的上下文能力:100万token输入与8万token输出。与此同时,MiniMax正在邀请用户测试其通用Agent。

错失先发优势后,这家曾被视为AI六小龙中最稳健的公司,正试图在下一阶段迎头赶上。它们迎来了一段时间窗口——2025年的Agent热潮。

那么,M1及正在内测的Agent究竟实力如何?是否能在明星AI初创公司和大厂的竞争中突围?

“直面AI”实际体验了M1,并对其技术报告进行了深度解读。

一、上下文+Agent能力是新模型核心

M1推理模型的特点是推理链较长,与近期国产开源前沿大模型类似。这类模型推理能力强,但推理链长可能导致输出偏差。

例如,对于一个“钢琴键盘可视化小游戏”的任务,M1耗时791.2秒才完成,大部分时间用于思考键盘与字母的搭配。尽管如此,它最终给出了完整的代码实现。

此外,M1的长上下文能力表现突出。在翻译一份33页包含大量图表的PDF文件时,M1完整保留了格式,包括表格和图片,并通过工具进行精准裁切。

总结来看,M1结构完整、反思能力强,但在实际能力上处于中等水平,未展现出惊艳之处。不过,这种特性非常适合Agent所需的技术架构。

二、MiniMax首款通用Agent:中规中矩

MiniMax Agent的能力可以分为两部分:前端效果较好,项目交付完整。例如,输入“制作一个介绍OpenAI发展历程的PPT风格网页”,Agent通过网络搜索、信息提取和自我审查,最终呈现了一个内容全面、设计细致的网页。

三、技术报告:不算惊艳但有干货

M1的表现可用“偏科生”形容,在常规基准测试中中规中矩。但在软件工程、长上下文处理和工具调用等复杂任务中,M1展现出显著优势。

M1的最大亮点是100万token的上下文输入能力和8万token的推理输出能力。其背后的闪电注意力机制大幅提升了处理效率,相比传统方法延迟降低了2700倍。

在强化学习方面,MiniMax提出CISPO算法,其收敛速度是现有算法的两倍。得益于这些创新,M1的训练成本仅为53.47万美元,远低于行业平均水平。

四、围战Agent的大趋势让MiniMax缓了一口气

2025年被认为是AI Agent之年,多家公司推出了相关产品。长上下文能力是关键,而M1在此方面优势明显。然而,Agent的成功还取决于工具调用、多模态理解和主模型性能等多种因素。

MiniMax在长上下文领域的技术优势为其提供了竞争力,但最终胜负取决于谁能将技术转化为用户价值。

原文链接
本文链接:https://kx.umi6.com/article/20416.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
投资界24h | MiniMax、智谱通过港交所聆讯;红杉中国买下「小脏鞋」;江苏社保科创基金完成备案
2025-12-22 10:41:44
人工智能公司 MiniMax 通过港交所聆讯,有望成为“AGI 全球第一股”
2025-12-21 21:01:50
MiniMax发布新一代音乐生成模型Music 2.6
2026-04-10 15:18:06
MiniMax涨超51% 总市值达773亿港元
2026-01-09 10:08:16
MiniMax发布命令行工具MMX-CLI
2026-04-09 12:08:20
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先
2026-03-25 15:37:07
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
超越AGI,阿里剑指“超级智能”
2025-09-24 18:49:07
给龙虾定MBTI、发工牌,还让龙虾偷技能…打工人得适应新环境了
2026-03-10 17:36:58
和闫俊杰一起敲钟的她:31岁,身价48亿
2026-01-12 17:44:50
龙虾养不动了?周鸿祎给虾搭了个云端办公室,专业私教在线炼虾
2026-05-22 23:07:18
阶跃Step 3.7 Flash登顶AA榜:速度、性价比、端到端三项第一
2026-06-05 14:59:31
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
2025-08-13 13:35:08
24小时热文
更多
扫一扫体验小程序