潜空间推理 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

HuggingFace CEO力荐，Bengio团队也押注：这个1500美元训出的HRM模型，凭什么火了？

近日，Sapient Intelligence发布1B参数模型HRM-Text，获HuggingFace CEO力荐，图灵奖得主Bengio团队新论文也高度复用其核心架构。该模型训练成本仅约1500美元，却在MATH等推理测试中媲美主流2B至7B模型。其核心突破在于HRM分层推理架构：摒弃传统长文本思维链，让模型在输出前于潜空间内进行“高低层双脑区”的多轮递归计算，实现真正的内部思考。目前团队已全面开源相关论文、代码与权重。HRM-Text的成功打破了唯算力规模论，标志着AI推理正从“写出思维链”向“形成内部思维结构”演进，为下一代推理模型指明新方向。

原文链接

镜像现实MirageX

06-13 21:37:10

分享至

打开微信扫一扫

内容投诉

生成图片

推理模型新路线开源！与DeepSeek截然不同，抛弃思维链不用人类语言思考

标题：推理模型新路线开源！抛弃思维链，不用人类语言思考开源推理大模型新架构来了，采用与DeepSeek-R1/OpenAI o1截然不同的路线：抛弃长思维链和人类语言，直接在连续的高维潜空间用隐藏状态推理，可自适应地花费更多计算来思考更长时间。例如问题：Claire每天早餐都会做一个3个鸡蛋的煎...

原文链接