2025年9月,明星AI创企Thinking Machines发布第二篇研究论文《Modular Manifolds》,提出通过约束神经网络各层/模块在统一框架下优化以提升训练稳定性与效率。论文由Jeremy Bernstein独立撰写,核心概念是将权重参数约束在Stiefel流形上,避免数值不稳定问题,并设计了适用于多模块的‘模块化流形’方法。小规模实验显示,新算法在准确率和权重稳定性上优于AdamW,但运行时间稍长。公司首篇论文于9月10日发布,主题为克服大语言模型推理中的不确定性。Thinking Machines估值已达840亿人民币,清华姚班校友陈丹琦及其团队也参与相关研究,近期发布了关于可验证奖励强化学习的新作。公司研究成果加速涌现,其首个产品备受期待。
原文链接
本文链接:https://kx.umi6.com/article/25979.html
转载请注明文章出处
相关推荐
换一换
陈丹琦有了个公司邮箱,北大翁荔同款
2025-08-28 11:16:05
最朴实的商战,掏100亿挖前员工
2025-08-15 14:15:17
翁荔陈丹琦加盟的840亿AI公司,公开第二篇论文
2025-09-27 13:42:07
她们估值840亿,刚发了第一个AI成果
2025-09-11 10:53:15
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
2024-08-06 11:19:51
Lilian Weng最新对话:首谈离开OpenAI创业,以及AI研究的现实扭曲场
2025-10-19 14:49:39
OpenAI原研究副总裁回归
2026-01-15 10:32:13
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
2025-03-05 14:04:44
AI泡沫化引发全球担忧情绪:一夜之间美股、金银、比特币、石油全崩了
2026-02-06 10:45:09
钉钉AI群聊全面升级:每个群聊配备专属助理“AI小钉”
2026-02-06 17:01:55
AI出海,掘金一个时代
2026-02-07 10:06:40
英国将与微软合作构建AI伪造内容检测系统
2026-02-05 18:04:20
交2690元学AI收入过万!BOSS直聘拆解新型“招转培”骗局
2026-02-05 21:10:47
660 文章
431155 浏览
24小时热文
更多
-
2026-02-07 22:25:40 -
2026-02-07 20:23:14 -
2026-02-07 20:22:16