1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:32B 推理模型 AM-Thinking-v1:超越 R1 的秘密

2025年,一支神秘团队低调开源了AM-Thinking-v1,一款32B稠密推理模型,在多个评测中击败DeepSeek-R1,性能媲美更大规模的MoE模型。这支名为A-M-team的团队,未依赖私有数据或海量资源,仅凭借开源技术和创新训练方法达成此成就。

AM-Thinking-v1在数学推理(AIME)和代码生成(LiveCodeBench)中分别获得85.3和70.3的高分,超越DeepSeek-R1。该模型采用后训练方案,包括冷启动监督微调、数据筛选及双阶段强化学习。团队通过优化学习率、增加输入长度、设计“先思考再回答”格式,使模型逻辑清晰且简洁。此外,他们严格清洗数据,确保质量,并利用GRPO算法结合难度感知策略,提升模型能力。

尽管AM-Thinking-v1尚不具备函数调用或多模态功能,但它证明了32B模型在推理上的巨大潜力。这一模型的诞生旨在探索低成本、高效率的推理路径,适合企业部署和多场景应用。

A-M-team希望回答一个核心问题:大模型能力能否用更小体量实现?AM-Thinking-v1给出了肯定的答案,展示了32B推理模型的独特价值。

原文链接
本文链接:https://kx.umi6.com/article/18669.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
现在香港打的:自动驾驶,方向盘能折叠
2024-12-02 17:56:41
瑞士工程巨头 ABB 扩大在华机器人布局,推出三款新品瞄准中国中型企业
2025-07-03 22:31:41
目标提前半年抢英伟达“肥肉”,消息称三星计划今年上半年完成 HBM4 开发
2025-01-13 12:52:43
24小时热文
更多
扫一扫体验小程序