CVPR满分论文:2080Ti搞定数据蒸馏,GPU仅需2G,出自上交大“最年轻博导”团队
只要一块6年前的2080Ti,就能完成大模型数据蒸馏?来自上交大EPIC实验室等机构的研究提出一种新方法——NFCM,显存占用仅1/300,速度提升20倍,相关论文获CVPR满分。
NCFM引入辅助神经网络,将数据集蒸馏转为minmax优化问题。在多个基准数据集上,NCFM展现高性能和可扩展性,仅需2GB GPU内存即可实现CIFAR数据集无损蒸馏。
核心是引入NCFD,通过交替优化合成数据和采样网络,提升合成数据质量和NCFD敏感性。NCFM在特征提取、频率参数采样、CF计算、NCFD度量及minmax优化等方面实现创新。
NCFM在CIFAR-10、CIFAR-100、ImageNet等多个数据集上超越现有方法,性能提升显著。同时,NCFM大幅节省资源,如在CIFAR-100上,每轮迭代时间比TESLA快29.4倍,GPU内存消耗仅为1/23.3。
本文第一作者王少博,现为上交大EPIC实验室博士生,导师张林峰,年仅27岁即成为博导。张林峰及其团队成员共同完成此研究。
原文链接
本文链接:https://kx.umi6.com/article/14689.html
转载请注明文章出处
相关推荐
换一换
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
2025-03-03 16:25:05
AI浏览器何时才能安全?
2026-03-07 00:49:29
农业农村部部长韩俊:目前智能采摘机器人、智能灌溉机器人、AI激光除草机器人等已在农业上开始使用
2026-03-09 11:34:34
高德发布全球首个由大模型驱动的视觉认知步行导引系统
2026-03-06 19:28:12
抖音电商打击AI虚假营销:处置仿冒李亚鹏、王丽云等名人侵权内容超16万条
2026-03-09 19:06:14
全网刷屏的“龙虾” 真的劝你不要盲目跟风!
2026-03-09 15:51:25
黑马图像模型被Nano Banana技术负责人点赞!15人华人小队,DDIM之父&CVPR最佳论文作者带队
2026-03-06 23:41:48
上海人工智能实验室推出DeepLink多元算力混合推理加速方案
2026-03-09 15:53:40
埃斯顿(2715.HK)今日登陆港交所 国产机器人龙头开启A+H新征程
2026-03-09 09:27:00
技术获 NVIDIA、Pi 双重认可!原力灵机 DM0 模型重塑具身智能新范式
2026-03-06 20:31:01
“最美PM”宋紫薇获红杉蚂蚁投资,创业方向略有调整,转向AI护肤
2026-03-09 14:44:41
全国人大代表张帆:建议研究出台加强工业数据集建设的财税支持政策
2026-03-06 19:29:19
中信证券:AI驱动保险发展,料将显著创造增量
2026-03-10 08:57:43
691 文章
480558 浏览
24小时热文
更多
-
2026-03-10 12:13:43 -
2026-03-10 11:10:02 -
2026-03-10 11:09:29