
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
上海 AI Lab 提出了一种基于结果奖励的强化学习新范式,仅通过微调和基于结果反馈的强化学习,就能在不蒸馏超大模型的情况下,超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。
当前大模型数学推理任务面临三大难题:稀疏奖励困境、局部正确陷阱和规模依...
原文链接
上海AI Lab打造了全球首个名为"GRUtopia"(中文名:桃源)的具身智能小镇,这是一个高度逼真的3D模拟环境,机器人能像人一样在超市购物、买菜做饭、接咖啡,甚至与NPC进行互动。小镇由10万多个交互式场景组成,涵盖89种类别,如超市、办公室等,旨在通过Sim2Real技术降低在真实世界中收集数据的难度和成本。项目开源,提供了控制机器人在虚拟环境中的demo。核心组成部分包括大规模场景数据集GRScenes、NPC系统GRResidents以及评估工具GRBench。研究团队通过大模型驱动NPC,提升机器人在多样化场景中的表现,如超市、医院等,且NPC系统的描述和定位准确性经验证。GRUtopia展示了在具身智能领域的先进性,并预示着通用机器人在更多生活和服务场景的应用前景。
原文链接
周伯文接任上海AI Lab主任,以新身份在WAIC 2024上发表演讲,提出AI-45° Law,倡导在AI发展过程中寻求安全与性能的平衡。他阐述了可信AGI的“因果之梯”理论,将其发展分为泛对齐、可干预和能反思三个阶段,强调了从现有的泛对齐向可干预和能反思阶段迈进的重要性。周伯文先前曾在京东担任高层领导,后创立衔远科技专注于电商领域生成式AI。今年,他履新上海AI Lab,致力于推动AI安全与性能的协调发展。
原文链接
加载更多

暂无内容