标题:32B 推理模型 AM-Thinking-v1:超越 R1 的秘密
2025年,一支神秘团队低调开源了AM-Thinking-v1,一款32B稠密推理模型,在多个评测中击败DeepSeek-R1,性能媲美更大规模的MoE模型。这支名为A-M-team的团队,未依赖私有数据或海量资源,仅凭借开源技术和创新训练方法达成此成就。
AM-Thinking-v1在数学推理(AIME)和代码生成(LiveCodeBench)中分别获得85.3和70.3的高分,超越DeepSeek-R1。该模型采用后训练方案,包括冷启动监督微调、数据筛选及双阶段强化学习。团队通过优化学习率、增加输入长度、设计“先思考再回答”格式,使模型逻辑清晰且简洁。此外,他们严格清洗数据,确保质量,并利用GRPO算法结合难度感知策略,提升模型能力。
尽管AM-Thinking-v1尚不具备函数调用或多模态功能,但它证明了32B模型在推理上的巨大潜力。这一模型的诞生旨在探索低成本、高效率的推理路径,适合企业部署和多场景应用。
A-M-team希望回答一个核心问题:大模型能力能否用更小体量实现?AM-Thinking-v1给出了肯定的答案,展示了32B推理模型的独特价值。
原文链接
本文链接:https://kx.umi6.com/article/18669.html
转载请注明文章出处
相关推荐
换一换
开源Agent模型榜第一名,现在是阿里通义DeepResearch
2025-09-18 15:54:31
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
马斯克背叛理想
2025-08-24 22:18:31
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
2025-06-13 12:06:17
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
“会操作手机的 AI”,智谱开源 AI Agent 模型 AutoGLM
2025-12-09 10:29:51
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升
2025-07-31 07:59:58
572 文章
339462 浏览
24小时热文
更多
-
2025-12-10 15:58:23 -
2025-12-10 15:57:24 -
2025-12-10 15:56:14