2025年12月,谢赛宁团队发布新论文《iREPA》,探讨视觉编码器表征生成性能的关键驱动因素。研究指出,空间结构而非全局语义信息决定了生成质量,这一结论颠覆了传统认知。论文源于8月的一场推特辩论,谢赛宁与网友讨论自监督学习模型在稠密任务中的表现,最终促成多团队合作完成研究。iREPA框架通过改进投影层和引入空间规范化,强化空间结构信息,仅需3行代码即可显著提升性能。研究覆盖27种视觉编码器及3种模型规模,并发现经典空间特征(如SIFT、HOG)也能媲美现代编码器。致谢部分特别感谢参与讨论的网友,体现了开放学术讨论的价值。
原文链接
本文链接:https://kx.umi6.com/article/30300.html
转载请注明文章出处
相关推荐
换一换
LeCun三顾茅庐,谢赛宁终于入伙!新公司获投10亿美元
2026-03-11 18:23:51
谢赛宁回应团队论文藏AI好评提示词:立正挨打,但是时候重新思考游戏规则了
2025-07-08 09:40:42
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
2025-08-20 13:13:44
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
慕尼黑工大Johannes Betz 教授:时速300公里的自动驾驶超车 | ICRA 2026
2026-06-04 16:14:04
月薪高达13万元!科技大厂掀起AI人才争夺战:35岁从业者成抢手资源
2026-06-08 12:26:28
LG砸重金采购万片英伟达GPU 全速冲刺AI转型
2026-06-07 23:56:41
国产之“光”爆单!AI算力需求太猛:光纤光缆企业订单排到2027年
2026-06-04 00:45:08
英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台
2026-06-04 16:10:54
AI掏空存储产能!美国九大行业联合请愿扩产芯片
2026-06-04 23:27:38
覆盖20多个垂直场景Agent!腾讯首发效率智能体工具集
2026-06-05 17:08:27
NVIDIA发布Cosmos 3:全球首个全开源物理AI全能模型面世
2026-06-05 00:32:58
CCIG 2026 在广州圆满落幕:4200 余位专家学者共绘图像图形发展新图景
2026-06-04 12:06:45
756 文章
684499 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41