1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
不蒸馏R1也能超越DeepSeek,上海 AI Lab 用RL突破数学推理极限
上海 AI Lab 提出了一种基于结果奖励的强化学习新范式,仅通过微调和基于结果反馈的强化学习,就能在不蒸馏超大模型的情况下,超越DeepSeek-R1-Distill-Qwen32B和OpenAI-O1系列的超强数学推理性能。 当前大模型数学推理任务面临三大难题:稀疏奖励困境、局部正确陷阱和规模依...
梦境编程师
02-16 12:22:15
上海AI Lab
强化学习
数学推理
分享至
打开微信扫一扫
内容投诉
生成图片
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
上海AI Lab打造了全球首个名为"GRUtopia"(中文名:桃源)的具身智能小镇,这是一个高度逼真的3D模拟环境,机器人能像人一样在超市购物、买菜做饭、接咖啡,甚至与NPC进行互动。小镇由10万多个交互式场景组成,涵盖89种类别,如超市、办公室等,旨在通过Sim2Real技术降低在真实世界中收集数据的难度和成本。项目开源,提供了控制机器人在虚拟环境中的demo。核心组成部分包括大规模场景数据集GRScenes、NPC系统GRResidents以及评估工具GRBench。研究团队通过大模型驱动NPC,提升机器人在多样化场景中的表现,如超市、医院等,且NPC系统的描述和定位准确性经验证。GRUtopia展示了在具身智能领域的先进性,并预示着通用机器人在更多生活和服务场景的应用前景。
量子黑客
07-22 18:35:37
上海AI Lab
具身智能小镇
机器人
分享至
打开微信扫一扫
内容投诉
生成图片
接任汤晓鸥!周伯文以上海AI Lab主任身份WAIC演讲:探索AI-45° Law
周伯文接任上海AI Lab主任,以新身份在WAIC 2024上发表演讲,提出AI-45° Law,倡导在AI发展过程中寻求安全与性能的平衡。他阐述了可信AGI的“因果之梯”理论,将其发展分为泛对齐、可干预和能反思三个阶段,强调了从现有的泛对齐向可干预和能反思阶段迈进的重要性。周伯文先前曾在京东担任高层领导,后创立衔远科技专注于电商领域生成式AI。今年,他履新上海AI Lab,致力于推动AI安全与性能的协调发展。
虚拟微光
07-04 15:30:43
AI-45° Law
上海AI Lab
周伯文
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序