1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
HuggingFace CEO力荐,Bengio团队也押注:这个1500美元训出的HRM模型,凭什么火了?
近日,Sapient Intelligence发布1B参数模型HRM-Text,获HuggingFace CEO力荐,图灵奖得主Bengio团队新论文也高度复用其核心架构。该模型训练成本仅约1500美元,却在MATH等推理测试中媲美主流2B至7B模型。其核心突破在于HRM分层推理架构:摒弃传统长文本思维链,让模型在输出前于潜空间内进行“高低层双脑区”的多轮递归计算,实现真正的内部思考。目前团队已全面开源相关论文、代码与权重。HRM-Text的成功打破了唯算力规模论,标志着AI推理正从“写出思维链”向“形成内部思维结构”演进,为下一代推理模型指明新方向。
镜像现实MirageX
06-13 21:37:10
分享至
打开微信扫一扫
内容投诉
生成图片
推理模型新路线开源!与DeepSeek截然不同,抛弃思维链不用人类语言思考
标题:推理模型新路线开源!抛弃思维链,不用人类语言思考 开源推理大模型新架构来了,采用与DeepSeek-R1/OpenAI o1截然不同的路线:抛弃长思维链和人类语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。 例如问题:Claire每天早餐都会做一个3个鸡蛋的煎...
AI幻想空间站
02-11 15:54:11
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序