1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

近日,一款名为Hierarchical Reasoning Model(HRM)的27M小模型引发关注。它在多项任务中表现优异,甚至超越了参数规模更大的o3-mini-high和DeepSeek-R1等模型。更令人惊叹的是,HRM无需预训练或思维链辅助,仅凭1000个训练样本,就能解决极端数独、30×30迷宫等复杂问题,并在衡量通用智能的ARC-AGI测试中击败众多“大前辈”。其开发者是00后清华校友、Sapient Intelligence创始人王冠,他曾拒绝马斯克的加入邀请,立志挑战Transformer架构。

HRM的核心在于仿脑设计,采用双层循环模块模拟大脑的分层处理与多时间尺度运作机制。高层模块负责抽象规划,低层模块专注细节计算,两者协同工作,确保全局方向正确且局部执行高效。此外,HRM还引入了分层收敛机制,避免过早收敛;近似梯度技术大幅降低内存需求;深度监督机制通过阶段性测试及时纠正偏差;自适应计算时间则动态分配资源,兼顾效率与准确性。

这些创新让HRM在多项任务中表现出色。例如,在9×9极端数独中,现有模型准确率为0%,而HRM几乎全对;在30×30迷宫任务中,其表现远超1.75亿参数的大型Transformer模型。尽管有人质疑HRM泛化能力有限,但其小而精的设计被认为在特定领域更具优势,且对过拟合有极强抵抗力。

王冠8岁开始编程,曾独立开发GitHub揽星5.1k项目OpenChat。2024年,他与联合创始人Austin创立Sapient Intelligence,致力于打造全新大模型架构。HRM的出现不仅是技术突破,更是对Transformer架构的一次大胆挑战。未来,这一仿脑设计或许能引领AI迈向新高度。

论文地址:https://arxiv.org/abs/2506.21734
代码地址:https://github.com/sapientinc/HRM

原文链接
本文链接:https://kx.umi6.com/article/23308.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同
2025-08-10 13:46:12
GPT-5为什么没有带来更多惊喜?
2025-08-10 14:47:11
超越 OpenAI 医疗能力全球登顶,百川发布开源 AI 大模型 Baichuan-M2
2025-08-11 14:01:35
已将机器人轴承纳入“十五五”业务板块规划 机器人概念股斩获五连板 本周机构密集调研相关上市公司
2025-08-10 22:52:44
奥尔特曼感到不安:ChatGPT正悄然左右用户的人生关键抉择
2025-08-11 22:12:06
AI裁员潮真的来了!美毕业生失业率飙至8.1% 这类人受冲击最大
2025-08-11 12:04:30
马斯克的最强 AI 模型 Grok 4 现已免费开放,非订阅用户每天可限量使用
2025-08-11 10:02:03
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
2025-08-11 16:03:42
百度搜索 PC 端首页全量上线系列 AI 功能,AI 搜索月活已超 3.22 亿人次
2025-08-11 14:02:19
互联网大厂2026届校招开启抢人大战:字节有实习生日薪5000元
2025-08-11 16:08:28
上海经信委组织2025年上海市促进产业高质量发展专项资金智能工厂领域项目申报
2025-08-11 16:09:35
高通:OpenAI 最小开源模型 gpt-oss-20b 可在骁龙终端运行
2025-08-11 22:08:24
华为即将发布AI推理领域突破性成果
2025-08-10 09:43:16
24小时热文
更多
扫一扫体验小程序