2025年8月,一篇关于DiT架构缺陷的帖子在社交媒体引发热议。博主引用论文指出,DiT存在隐性架构问题,如FID过早稳定、后层归一化不稳定及adaLN-zero限制表达能力等。DiT作者、纽约大学助理教授谢赛宁回应称,质疑需基于实验而非空想,并解释DiT的改进方向,包括Lightning DiT升级版和VA-VAE等方法。他承认DiT有硬伤,如sd-vae效率低,但强调其仍是当前主流架构。谢赛宁呼吁科学质疑应基于假设与验证,而非仅为吸引关注。
原文链接
本文链接:https://kx.umi6.com/article/23862.html
转载请注明文章出处
相关推荐
换一换
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
2025-08-20 13:13:44
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型
2024-07-05 10:42:38
谢赛宁回应团队论文藏AI好评提示词:立正挨打,但是时候重新思考游戏规则了
2025-07-08 09:40:42
OpenAI也来了,巨头为何决战AI浏览器?
2025-10-23 10:04:31
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
太疯狂了!Meta裁员裁到田渊栋头上,连组员一锅端
2025-10-23 13:04:46
肖远企:目前AI在金融领域的应用仍处于早期阶段 无法取代人的决策
2025-10-23 16:12:32
超800名科技领袖联合呼吁:停止研发超级智能
2025-10-22 18:51:33
荣耀推出 AI Connect 平台,发布八大 AI 场景化生态解决方案
2025-10-23 17:12:06
OpenAI合作伙伴Crusoe在新一轮融资中估值达100亿美元
2025-10-24 03:21:23
六大AI实盘交易追踪:中国模型收益领跑,GPT本金亏到不足三成
2025-10-23 18:12:20
沐曦集成科创板IPO上会在即 十余家上市公司互动易回复参股投资
2025-10-23 21:15:29
569 文章
300025 浏览
24小时热文
更多
-
2025-10-24 09:32:35 -
2025-10-24 09:31:18 -
2025-10-24 09:30:10