2025年9月,明星AI创企Thinking Machines发布第二篇研究论文《Modular Manifolds》,提出通过约束神经网络各层/模块在统一框架下优化以提升训练稳定性与效率。论文由Jeremy Bernstein独立撰写,核心概念是将权重参数约束在Stiefel流形上,避免数值不稳定问题,并设计了适用于多模块的‘模块化流形’方法。小规模实验显示,新算法在准确率和权重稳定性上优于AdamW,但运行时间稍长。公司首篇论文于9月10日发布,主题为克服大语言模型推理中的不确定性。Thinking Machines估值已达840亿人民币,清华姚班校友陈丹琦及其团队也参与相关研究,近期发布了关于可验证奖励强化学习的新作。公司研究成果加速涌现,其首个产品备受期待。
原文链接
本文链接:https://kx.umi6.com/article/25979.html
转载请注明文章出处
相关推荐
换一换
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
2024-08-06 11:19:51
OpenAI原研究副总裁回归
2026-01-15 10:32:13
陈丹琦有了个公司邮箱,北大翁荔同款
2025-08-28 11:16:05
Lilian Weng最新对话:首谈离开OpenAI创业,以及AI研究的现实扭曲场
2025-10-19 14:49:39
最朴实的商战,掏100亿挖前员工
2025-08-15 14:15:17
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
2025-03-05 14:04:44
她们估值840亿,刚发了第一个AI成果
2025-09-11 10:53:15
SpaceX受邀加入开发“金穹顶”软件的行业团队
2026-04-23 03:43:35
英特尔第一季度营收136亿美元 同比增长7.2%
2026-04-24 08:00:05
昆仑万维2025年营收同比增长44.78%至81.98亿 “4+3”战略构建AI Native平台经济新范式
2026-04-23 21:31:07
千问总裁吴嘉:“AI办事”对外开放 首家接入东方航空
2026-04-23 11:02:47
飞书项目开放平台焕新升级,全面迈向“AI Friendly”
2026-04-23 18:20:13
Anthropic二级市场估值升至万亿美元 超越OpenAI
2026-04-23 14:11:46
722 文章
562129 浏览
24小时热文
更多
-
2026-04-24 13:15:05 -
2026-04-24 13:14:01 -
2026-04-24 13:12:56