2025年8月,一篇关于DiT架构缺陷的帖子在社交媒体引发热议。博主引用论文指出,DiT存在隐性架构问题,如FID过早稳定、后层归一化不稳定及adaLN-zero限制表达能力等。DiT作者、纽约大学助理教授谢赛宁回应称,质疑需基于实验而非空想,并解释DiT的改进方向,包括Lightning DiT升级版和VA-VAE等方法。他承认DiT有硬伤,如sd-vae效率低,但强调其仍是当前主流架构。谢赛宁呼吁科学质疑应基于假设与验证,而非仅为吸引关注。
原文链接
本文链接:https://kx.umi6.com/article/23862.html
转载请注明文章出处
相关推荐
.png)
换一换
腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型
2024-07-05 10:42:38
谢赛宁回应团队论文藏AI好评提示词:立正挨打,但是时候重新思考游戏规则了
2025-07-08 09:40:42
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
2025-08-20 13:13:44
AI 领域亦对手亦客户:消息称 Meta 与谷歌云签订 6 年超 100 亿美元大单
2025-08-22 14:51:49
回调恰是买入良机?美投行力挺科技牛市:英伟达财报或点燃AI新行情
2025-08-21 16:38:55
DeepSeek-V3.1正式发布
2025-08-21 15:36:49
群核科技更新招股书:上半年扭亏为盈 与智元机器人、银河通用等达成合作
2025-08-22 20:53:52
AI每次文本请求仅耗5滴水 谷歌环保账单被质疑美化
2025-08-22 10:50:15
中信建投:卫星互联网建设有望加速 关注商业航天投资机会
2025-08-22 08:45:06
DeepSeek-V3.1 正式发布,官方详解迈向 AI Agent 时代的第一步
2025-08-21 15:34:29
苹果据悉探索利用谷歌Gemini为新版Siri赋能
2025-08-23 02:55:42
GPT升级后,消失的赛博恋人
2025-08-21 15:35:56
497 文章
126563 浏览
24小时热文
更多

-
2025-08-23 03:55:57
-
2025-08-23 02:55:42
-
2025-08-22 23:54:20