2025年12月,谢赛宁团队发布新论文《iREPA》,探讨视觉编码器表征生成性能的关键驱动因素。研究指出,空间结构而非全局语义信息决定了生成质量,这一结论颠覆了传统认知。论文源于8月的一场推特辩论,谢赛宁与网友讨论自监督学习模型在稠密任务中的表现,最终促成多团队合作完成研究。iREPA框架通过改进投影层和引入空间规范化,强化空间结构信息,仅需3行代码即可显著提升性能。研究覆盖27种视觉编码器及3种模型规模,并发现经典空间特征(如SIFT、HOG)也能媲美现代编码器。致谢部分特别感谢参与讨论的网友,体现了开放学术讨论的价值。
原文链接
本文链接:https://kx.umi6.com/article/30300.html
转载请注明文章出处
相关推荐
换一换
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
2025-08-20 13:13:44
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
谢赛宁回应团队论文藏AI好评提示词:立正挨打,但是时候重新思考游戏规则了
2025-07-08 09:40:42
推特吵架吵出篇论文!谢赛宁团队新作iREPA只要3行代码
2025-12-16 15:46:27
问岐健康完成千万级Pre-A轮融资,专注中医智能化服务
2025-12-15 11:34:33
Siri难道是装傻?
2025-12-16 10:33:30
“镁代铝”成真,首批人形机器人镁合金电池盒交付
2025-12-16 18:56:34
OpenAI合作项目驱动对AI领军企业多年期业绩预期的上调
2025-12-15 21:00:57
SK海力士、三星向英伟达交付付费版HBM4样品
2025-12-16 10:35:44
阿里发布电影级视频模型万相2.6
2025-12-16 13:40:51
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1
2025-12-15 14:40:21
OpenAI首席传播官将离职
2025-12-16 12:39:41
广西:加快建设中国—东盟人工智能创新合作中心、中国—东盟人工智能工业设计中心等创新服务平台
2025-12-15 14:47:07
618 文章
362463 浏览
24小时热文
更多
-
2025-12-17 08:31:57 -
2025-12-17 08:30:53 -
2025-12-17 08:28:48