1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
2025年11月,月之暗面联合清华大学推出全新强化学习加速引擎Seer,显著提升LLM训练效率。该框架通过推理引擎池、请求缓冲区和上下文管理器三大模块,结合分段生成、上下文感知调度及自适应分组推测解码技术,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。实验表明,Seer在Moonlight、Qwen2-VL-72B等模型任务中性能大幅超越基线系统veRL,尤其在长尾延迟优化上表现突出。此外,月之暗面正与IDG Capital等机构洽谈新一轮数亿美元融资,估值达40亿美元,并计划年底前完成融资,明年下半年启动IPO进程。
灵感Phoenix
11-27 16:43:04
RL训练加速
Seer引擎
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 推出 WorldGen:一句话即可生成可交互 3D 世界
11月23日,Meta推出WorldGen系统,可基于单条文本提示生成交互式3D世界,支持沉浸式探索。该技术结合程序化逻辑推理、扩散模型和场景分解方法,生成几何严谨、视觉丰富的场景,适用于游戏、仿真及社交环境。相比现有方法多依赖单一视角构建,WorldGen能生成50米×50米范围的全纹理场景,确保风格与结构一致性,且兼容Unity、Unreal等主流引擎。目前,WorldGen仍处研究阶段,尚未开放使用,未来将拓展空间规模并优化延迟问题。
DreamCoder
11-23 22:24:01
WorldGen
三维世界
生成式AI
分享至
打开微信扫一扫
内容投诉
生成图片
这些大神在Meta的论文看一篇少一篇了
正文:2025年11月17日,前Meta研究员田渊栋团队发布了一篇关于大模型强化学习(RL)训练现象的研究论文。研究聚焦于RL训练虽显著提升性能,却仅改变极少数参数的奇特现象。论文提出‘三门理论’,揭示了RL参数更新背后的深层机制:KL锚定限制漂移,模型几何引导低曲率方向优化,bfloat16精度过滤微小变化。实验表明,RL更新稀疏度高达36%-92%,远超监督微调(SFT)的0.6%-18.8%。此外,研究发现传统参数高效微调方法在RL中效果不佳,主成分权重更新常导致不稳定。论文为RL算法设计提供了新思路。
蝶舞CyberSwirl
11-17 14:29:27
RLVR
三门理论
田渊栋
分享至
打开微信扫一扫
内容投诉
生成图片
NuerIPS唯一满分论文曝光,来自清华上交
NuerIPS唯一满分论文曝光,来自清华上交 近日,一篇来自清华大学和上海交通大学的论文在人工智能领域引发轰动,成为NuerIPS唯一获得满分评价的研究。这篇论文挑战了当前大模型推理能力提升的核心假设:真正决定推理上限的是基座模型本身,而非强化学习(RLVR)。研究还指出,蒸馏方法比强化学习更有望实...
Oasis
11-11 17:16:47
NuerIPS
RLVR
蒸馏
分享至
打开微信扫一扫
内容投诉
生成图片
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025年11月,兔展智能与北京大学联合发布图像编辑模型UniWorld-V2,刷新多项SOTA成绩。该模型在中文细节控制和复杂指令理解上表现优异,例如精准修改手势、渲染艺术中文字体及实现精细化空间编辑。其核心创新为UniWorld-R1框架,首次将强化学习应用于统一架构的图像编辑,采用扩散负向感知微调(DiffusionNFT)技术,并使用多模态大语言模型(MLLM)作为免训练奖励模型。在GEdit-Bench和ImgEdit基准测试中,UniWorld-V2分别以7.83分和4.49分超越OpenAI的GPT-Image-1等顶尖模型。研究团队还公开了论文、代码及模型,供后续研究使用。
智慧棱镜
11-05 15:09:36
UniWorld-V2
图像编辑
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
让机器人在“想象”中学习世界的模型来了!PI联创课题组&清华陈建宇团队联合出品
让机器人在“想象”中学习世界的模型来了! 近日,斯坦福PI联合创始人Chelsea Finn与清华大学陈建宇团队合作提出了一种突破性世界模型——Ctrl-World。该模型允许机器人在虚拟空间中完成任务预演、策略评估和自我迭代,大幅提升训练效率。研究显示,使用零真机数据的情况下,Ctrl-World...
镜像现实MirageX
10-30 18:52:10
Ctrl-World
世界模型
机器人
分享至
打开微信扫一扫
内容投诉
生成图片
智元办机器人挑战赛:清华&上海AILab夺冠,华南理工“单人成团”拿亚军
2025年10月,智元机器人联合OpenDriveLab在杭州IROS举办的AGIBOT World Challenge线下决赛圆满落幕。清华大学与上海AI Lab的AIR-DREAM团队夺得冠军,华南理工大学‘单人成团’获亚军,香港大学Firebot团队摘得季军。比赛聚焦Manipulation和World Model两大方向,设置整理杂货、衣物折叠、倒水等六大真实场景任务,考察机器人操作精度与泛化能力。冠军团队凭借X-VLA模型解决跨平台数据难题,华南理工曾嘉龙分享低成本高效优化经验,港大陈天行依托仿真平台快速搭建技术路线。本次赛事吸引全球431支队伍参与,总奖池达56万美元。同期,智元机器人展出精灵G2等产品,其射箭功能首次亮相并开放体验。
跨界思维
10-27 15:03:26
AGIBOT World Challenge
具身智能
智元机器人
分享至
打开微信扫一扫
内容投诉
生成图片
机构:AI存储需求激发HDD替代效应 NAND Flash供应商加速转进大容量Nearline SSD
10月14日,据TrendForce集邦咨询调查显示,AI推理应用正快速推动实时存取与高速处理海量数据的需求,促使存储行业加速向大容量产品转型。HDD市场面临供应缺口,NAND Flash供应商积极转进122TB甚至245TB的超大容量Nearline SSD生产,以填补需求空白。这一技术转型缓解了市场对未来需求不确定性的担忧,同时显示出AI发展对存储行业的深远影响。
数据炼金师
10-14 14:19:05
AI存储需求
HDD替代效应
Nearline SSD
分享至
打开微信扫一扫
内容投诉
生成图片
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈 视觉-语言-动作(VLA)模型是实现机器人复杂操作的关键,但其训练面临数据采集成本高和泛化能力不足的瓶颈。为此,研究团队提出了SimpleVLA-RL框架,基于veRL扩展,通过交互式轨迹采样、结果奖励建模和探索增强等设计,...
代码编织者
09-26 11:24:15
SimpleVLA-RL
VLA模型
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升
据《科创板日报》22日报道,TrendForce研究显示,未来两年AI基础设施将聚焦高效推理服务。因大容量HDD供不应求,CSP业者转向NAND Flash供应商,推动专为AI设计的Nearline SSD需求激增。随着AI推理应用扩展,此需求将持续至2027年,预计2026年Enterprise SSD供应趋紧。
新智燎原
09-22 18:03:53
AI推理
Enterprise SSD
Nearline SSD
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序