综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,Sapient Intelligence发布1B参数模型HRM-Text,获HuggingFace CEO力荐,图灵奖得主Bengio团队新论文也高度复用其核心架构。该模型训练成本仅约1500美元,却在MATH等推理测试中媲美主流2B至7B模型。其核心突破在于HRM分层推理架构:摒弃传统长文本思维链,让模型在输出前于潜空间内进行“高低层双脑区”的多轮递归计算,实现真正的内部思考。目前团队已全面开源相关论文、代码与权重。HRM-Text的成功打破了唯算力规模论,标志着AI推理正从“写出思维链”向“形成内部思维结构”演进,为下一代推理模型指明新方向。
原文链接
标题:推理模型新路线开源!抛弃思维链,不用人类语言思考
开源推理大模型新架构来了,采用与DeepSeek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。
例如问题:Claire每天早餐都会做一个3个鸡蛋的煎...
原文链接
加载更多
暂无内容