我MiniMax，用实习生处理数据，照样屠榜开源大模型

2025-11-04 14:15:32

量子黑客

发布在

科普

阅读：2448

我MiniMax，用实习生处理数据，照样屠榜开源大模型

MiniMax的M2模型近期在开源社区引发热议，其凭借卓越表现横扫多个榜单，甚至在香港大学的AI-Trader模拟A股大赛中，用10万本金20天赚了近3000元。M2之所以备受关注，不仅因其性能强悍，更因背后的技术路径独树一帜。

相比前代M1采用Linear Attention，M2回归传统Full Attention机制。团队坦言，这一选择源于实际测试：尽管Linear Attention等高效机制节省算力，但在复杂任务和长上下文场景下表现不佳。经过大量实验，他们发现Full Attention在稳定性和可靠性上无可替代，即便尝试多种变体如GDN或Mamba2，结果依然如此。

此外，M2的数据处理方式也别具匠心。团队雇佣实习生完成数据筛选，借此证明其流程的高度成熟。M2将数据质量拆解为思维链（CoT）和Response两个维度，注重逻辑完整性和格式多样性，并刻意减少对特定榜单格式的依赖。同时，团队通过规则和大模型判断构建数据清洗流程，剔除“坏数据”，确保训练数据广泛且优质。

为解决“高分低能”问题，M2引入“交错式思维链”策略，让模型在任务执行中动态调整规划，形成“计划→行动→反思”的循环。这种方法显著提升了模型在复杂任务中的容错率和适应能力。此外，团队还设计了覆盖全轨迹扰动的训练数据链路，模拟真实场景中的不确定性，进一步增强泛化能力。

MiniMax的选择体现了工程理性的优先级：无论结构设计还是技术路径，始终以实际落地为目标。正如M2所展示的，一个真正可用的工具远比追求参数堆叠的“炫技模型”更有价值。在当下大模型百花齐放的时代，MiniMax提供了一种面向复杂现实问题的解决方案，而这或许才是技术发展的核心意义。

原文链接

本文链接：https://kx.umi6.com/article/27759.html

转载请注明文章出处

Full Attention