综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月7日,CVPR 2026主会议闭幕,三大信号引爆全网。奖项端,Google DeepMind的D4RT斩获最佳论文,牛津VGG两连冠;何恺明团队ResNet与YOLO获时间检验奖;微软×清华TRELLIS.2获最佳学生论文奖。数据端,PhysInOne数据集发布,迎来“视觉物理ImageNet时刻”,具身智能论文爆发。人才与产业端,中国力量成焦点:大三学生凭老泰坦GPU获最佳学生论文提名,两本科生半年揽5篇顶会引热议;美团开源560B参数LongCat大模型,字节亮相图像修复新范式。计算机视觉正迈向理解世界的新纪元!
原文链接
2026年1月,谷歌DeepMind发布Dynamic 4D Reconstruction and Tracking(D4RT),革新4D动态重建技术。该模型通过统一的“时空查询”接口,同时实现全像素追踪、深度估计与相机位姿计算,精度领先且比现有SOTA快18至300倍。D4RT可实时处理动态场景,如奔跑的动物或飘动的花瓣,并支持全像素级轨迹预测,为具身智能、自动驾驶和AR领域带来突破性进展。其架构基于Transformer,将视频压缩为全局表征并通过并行查询提升效率。尽管训练成本高,但推理阶段表现出色,未来可能应用于手机视频编辑与实时AR场景。
原文链接
加载更多
暂无内容