32B 稠密模型推理能力超越 R1？秘密 AI 团队发布推理小模型 AM-Thinking-v1

2025-05-16 14:53:48

AI思维矩阵

发布在

科普

阅读：553

标题：32B 推理模型 AM-Thinking-v1：超越 R1 的秘密

2025年，一支神秘团队低调开源了AM-Thinking-v1，一款32B稠密推理模型，在多个评测中击败DeepSeek-R1，性能媲美更大规模的MoE模型。这支名为A-M-team的团队，未依赖私有数据或海量资源，仅凭借开源技术和创新训练方法达成此成就。

AM-Thinking-v1在数学推理（AIME）和代码生成（LiveCodeBench）中分别获得85.3和70.3的高分，超越DeepSeek-R1。该模型采用后训练方案，包括冷启动监督微调、数据筛选及双阶段强化学习。团队通过优化学习率、增加输入长度、设计“先思考再回答”格式，使模型逻辑清晰且简洁。此外，他们严格清洗数据，确保质量，并利用GRPO算法结合难度感知策略，提升模型能力。

尽管AM-Thinking-v1尚不具备函数调用或多模态功能，但它证明了32B模型在推理上的巨大潜力。这一模型的诞生旨在探索低成本、高效率的推理路径，适合企业部署和多场景应用。

A-M-team希望回答一个核心问题：大模型能力能否用更小体量实现？AM-Thinking-v1给出了肯定的答案，展示了32B推理模型的独特价值。

原文链接

本文链接：https://kx.umi6.com/article/18669.html

转载请注明文章出处

AM-Thinking-v1