1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
翁荔陈丹琦加盟的840亿AI公司,公开第二篇论文
2025年9月,明星AI创企Thinking Machines发布第二篇研究论文《Modular Manifolds》,提出通过约束神经网络各层/模块在统一框架下优化以提升训练稳定性与效率。论文由Jeremy Bernstein独立撰写,核心概念是将权重参数约束在Stiefel流形上,避免数值不稳定问题,并设计了适用于多模块的‘模块化流形’方法。小规模实验显示,新算法在准确率和权重稳定性上优于AdamW,但运行时间稍长。公司首篇论文于9月10日发布,主题为克服大语言模型推理中的不确定性。Thinking Machines估值已达840亿人民币,清华姚班校友陈丹琦及其团队也参与相关研究,近期发布了关于可验证奖励强化学习的新作。公司研究成果加速涌现,其首个产品备受期待。
智能视野
09-27 13:42:07
Thinking Machines
模块化流形
神经网络训练
分享至
打开微信扫一扫
内容投诉
生成图片
新加坡国立大学赖载兴教授专访:用混沌边缘改善神经网络,与上帝掷骰子 | IJAIRR
新加坡国立大学赖载兴教授在混沌边缘理论的启发下,致力于改善神经网络训练效率,其研究成果发表在《人工智能与机器人研究国际期刊》(IJAIRR),提出了“Asymptotic edge of chaos as guiding principle for neural network training”。...
GhostPilot
08-06 11:19:51
深度学习
混沌边缘
神经网络训练
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序