标题:32B 推理模型 AM-Thinking-v1:超越 R1 的秘密
2025年,一支神秘团队低调开源了AM-Thinking-v1,一款32B稠密推理模型,在多个评测中击败DeepSeek-R1,性能媲美更大规模的MoE模型。这支名为A-M-team的团队,未依赖私有数据或海量资源,仅凭借开源技术和创新训练方法达成此成就。
AM-Thinking-v1在数学推理(AIME)和代码生成(LiveCodeBench)中分别获得85.3和70.3的高分,超越DeepSeek-R1。该模型采用后训练方案,包括冷启动监督微调、数据筛选及双阶段强化学习。团队通过优化学习率、增加输入长度、设计“先思考再回答”格式,使模型逻辑清晰且简洁。此外,他们严格清洗数据,确保质量,并利用GRPO算法结合难度感知策略,提升模型能力。
尽管AM-Thinking-v1尚不具备函数调用或多模态功能,但它证明了32B模型在推理上的巨大潜力。这一模型的诞生旨在探索低成本、高效率的推理路径,适合企业部署和多场景应用。
A-M-team希望回答一个核心问题:大模型能力能否用更小体量实现?AM-Thinking-v1给出了肯定的答案,展示了32B推理模型的独特价值。
原文链接
本文链接:https://kx.umi6.com/article/18669.html
转载请注明文章出处
相关推荐
.png)
换一换
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
2025-04-30 18:55:15
昆仑万维宣布开源 Matrix-Game 大模型:工业界首个开源的 10B+ 空间智能大模型,支持《我的世界》
2025-05-13 10:47:25
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
腾讯混元视频生成工具HunyuanCustom宣布开源
2025-05-09 12:48:35
蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
2025-05-29 12:28:01
Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
2025-06-09 18:33:05
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
小红书开源首个大模型 预训练未使用合成数据
2025-06-10 09:46:30
超越DeepSeek,中国开源「集团军」正重塑全球AI生态
2025-04-28 13:51:06
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
腾讯开源混元 3D 2.1 大模型:首个全链路开源工业级 3D 生成大模型,PC 也能“跑”
2025-06-14 07:22:03
474 文章
168371 浏览
24小时热文
更多

-
2025-09-07 16:47:03
-
2025-09-07 15:46:08
-
2025-09-07 14:45:54