1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年9月,明星AI创企Thinking Machines发布第二篇研究论文《Modular Manifolds》,提出通过约束神经网络各层/模块在统一框架下优化以提升训练稳定性与效率。论文由Jeremy Bernstein独立撰写,核心概念是将权重参数约束在Stiefel流形上,避免数值不稳定问题,并设计了适用于多模块的‘模块化流形’方法。小规模实验显示,新算法在准确率和权重稳定性上优于AdamW,但运行时间稍长。公司首篇论文于9月10日发布,主题为克服大语言模型推理中的不确定性。Thinking Machines估值已达840亿人民币,清华姚班校友陈丹琦及其团队也参与相关研究,近期发布了关于可验证奖励强化学习的新作。公司研究成果加速涌现,其首个产品备受期待。

原文链接
本文链接:https://kx.umi6.com/article/25979.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
2024-08-06 11:19:51
最朴实的商战,掏100亿挖前员工
2025-08-15 14:15:17
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
2025-03-05 14:04:44
翁荔陈丹琦加盟的840亿AI公司,公开第二篇论文
2025-09-27 13:42:07
她们估值840亿,刚发了第一个AI成果
2025-09-11 10:53:15
陈丹琦有了个公司邮箱,北大翁荔同款
2025-08-28 11:16:05
拓普集团投资成立机器人部件公司
2025-09-26 13:28:57
金马游乐等成立新公司 含AI及机器人研发、制造等业务
2025-09-26 13:30:02
英伟达「误伤」一颗芯片
2025-09-26 11:26:32
美格智能:5G高速率通信模组已应用于国内某机器人企业的人形机器人产品
2025-09-26 13:29:17
从股市到债市:美国大科技公司为AI狂掘千亿级融资
2025-09-26 18:32:57
你的最快安卓芯片发布了!全面为Agent铺路
2025-09-26 09:20:24
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
24小时热文
更多
扫一扫体验小程序