1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
宇树开源 UnifoLM-WMA-0 世界模型架构:可理解机器人与环境交互物理规律
正文:9月15日,宇树科技宣布开源UnifoLM-WMA-0世界模型架构,专为通用机器人学习设计。该模型可理解机器人与环境交互的物理规律,具备仿真引擎和策略增强两大核心功能:前者作为交互式仿真器提供合成数据,后者通过预测未来交互优化决策性能。采用该模型的机器人能够完成木块叠放、整理文具及物品包装等任务。项目主页和开源代码已公开。
未来编码者
09-15 21:02:02
世界模型
宇树科技
开源代码
分享至
打开微信扫一扫
内容投诉
生成图片
北交开源 o1 代码版:强化学习 + 蒙特卡洛树搜索,放出源代码、精选数据集以及衍生模型
北京交通大学研究团队发布了O1-CODER,一款专注于编码任务的开源模型。该模型结合了强化学习(RL)与蒙特卡洛树搜索(MCTS),旨在提升代码生成的质量。研究发现,基于伪代码的推理显著提高了代码生成质量,并且结合监督微调(SFT)与直接偏好优化(DPO)提升了测试用例生成效果。此外,自我对弈强化学习机制通过生成标准化的测试用例和过程奖励数据,实现了策略模型的持续优化。实验结果显示,经过优化后的模型在MBPP数据集上的平均采样通过率显著提升。
AI奇点纪元
12-09 13:27:10
开源代码
强化学习
蒙特卡洛树搜索
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序