1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

近日,一款名为Hierarchical Reasoning Model(HRM)的27M小模型引发关注。它在多项任务中表现优异,甚至超越了参数规模更大的o3-mini-high和DeepSeek-R1等模型。更令人惊叹的是,HRM无需预训练或思维链辅助,仅凭1000个训练样本,就能解决极端数独、30×30迷宫等复杂问题,并在衡量通用智能的ARC-AGI测试中击败众多“大前辈”。其开发者是00后清华校友、Sapient Intelligence创始人王冠,他曾拒绝马斯克的加入邀请,立志挑战Transformer架构。

HRM的核心在于仿脑设计,采用双层循环模块模拟大脑的分层处理与多时间尺度运作机制。高层模块负责抽象规划,低层模块专注细节计算,两者协同工作,确保全局方向正确且局部执行高效。此外,HRM还引入了分层收敛机制,避免过早收敛;近似梯度技术大幅降低内存需求;深度监督机制通过阶段性测试及时纠正偏差;自适应计算时间则动态分配资源,兼顾效率与准确性。

这些创新让HRM在多项任务中表现出色。例如,在9×9极端数独中,现有模型准确率为0%,而HRM几乎全对;在30×30迷宫任务中,其表现远超1.75亿参数的大型Transformer模型。尽管有人质疑HRM泛化能力有限,但其小而精的设计被认为在特定领域更具优势,且对过拟合有极强抵抗力。

王冠8岁开始编程,曾独立开发GitHub揽星5.1k项目OpenChat。2024年,他与联合创始人Austin创立Sapient Intelligence,致力于打造全新大模型架构。HRM的出现不仅是技术突破,更是对Transformer架构的一次大胆挑战。未来,这一仿脑设计或许能引领AI迈向新高度。

论文地址:https://arxiv.org/abs/2506.21734
代码地址:https://github.com/sapientinc/HRM

原文链接
本文链接:https://kx.umi6.com/article/23308.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?
2026-06-13 21:37:10
AI造假骗单坑哭无数商家 微信警告:后果比你想得严重
2026-06-09 19:38:23
AI误判致美国男子含冤入狱三月 人生坠入“斩杀线”
2026-06-10 01:48:40
Nature 子刊收录!清华李勇团队用 AI 解码全球气候耦合,ENSO 预测提前期延长至 19 个月
2026-06-12 14:36:27
不满家人使用ChatGPT 美大学生与母亲争吵后在日本死亡
2026-06-09 19:36:53
谷歌推出DiffusionGemma文本扩散AI模型:本地AI推理速度提4倍
2026-06-11 18:54:12
造谣小米员工破坏展车、AI伪造事故视频!两名网络用户公开道歉
2026-06-08 18:42:21
AI狂欢要散场了吗
2026-06-09 00:54:40
生成预测四大权威榜单第一!开悟世界模型确立具身智能世界模型新标杆
2026-06-12 13:33:13
神了,世界杯第一天真按千问剧本踢了
2026-06-13 00:54:30
从诺奖项目到生成式药物设计,Latent Labs 创始人 Simon Kohl:AI 正在让生物学进入「可编程时代」 | CVPR 2026
2026-06-09 16:28:09
Kimi宣布全球首张AI原生信用卡开启预约:消费就能兑换算力额度
2026-06-12 18:45:38
理想汽车、清华联合团队最新成果被权威期刊收录:AI将事故中头部损伤降低六成
2026-06-10 10:04:50
24小时热文
更多
扫一扫体验小程序