1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:32B 推理模型 AM-Thinking-v1:超越 R1 的秘密

2025年,一支神秘团队低调开源了AM-Thinking-v1,一款32B稠密推理模型,在多个评测中击败DeepSeek-R1,性能媲美更大规模的MoE模型。这支名为A-M-team的团队,未依赖私有数据或海量资源,仅凭借开源技术和创新训练方法达成此成就。

AM-Thinking-v1在数学推理(AIME)和代码生成(LiveCodeBench)中分别获得85.3和70.3的高分,超越DeepSeek-R1。该模型采用后训练方案,包括冷启动监督微调、数据筛选及双阶段强化学习。团队通过优化学习率、增加输入长度、设计“先思考再回答”格式,使模型逻辑清晰且简洁。此外,他们严格清洗数据,确保质量,并利用GRPO算法结合难度感知策略,提升模型能力。

尽管AM-Thinking-v1尚不具备函数调用或多模态功能,但它证明了32B模型在推理上的巨大潜力。这一模型的诞生旨在探索低成本、高效率的推理路径,适合企业部署和多场景应用。

A-M-team希望回答一个核心问题:大模型能力能否用更小体量实现?AM-Thinking-v1给出了肯定的答案,展示了32B推理模型的独特价值。

原文链接
本文链接:https://kx.umi6.com/article/18669.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发
2025-06-12 16:39:43
小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,对话自然度、交互适配达拟人化水准
2025-09-19 11:13:29
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
GPT-5 难产内幕曝光:核心团队遭挖空,推理魔咒难破,靠英伟达续命
2025-08-02 17:22:34
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
小米多模态大模型 MiMo-VL 开源,官方称多方面领先 Qwen2.5-VL-7B
2025-05-30 16:57:55
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型
2025-06-05 15:52:55
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
24小时热文
更多
扫一扫体验小程序