CVPR满分论文:2080Ti搞定数据蒸馏,GPU仅需2G,出自上交大“最年轻博导”团队
只要一块6年前的2080Ti,就能完成大模型数据蒸馏?来自上交大EPIC实验室等机构的研究提出一种新方法——NFCM,显存占用仅1/300,速度提升20倍,相关论文获CVPR满分。
NCFM引入辅助神经网络,将数据集蒸馏转为minmax优化问题。在多个基准数据集上,NCFM展现高性能和可扩展性,仅需2GB GPU内存即可实现CIFAR数据集无损蒸馏。
核心是引入NCFD,通过交替优化合成数据和采样网络,提升合成数据质量和NCFD敏感性。NCFM在特征提取、频率参数采样、CF计算、NCFD度量及minmax优化等方面实现创新。
NCFM在CIFAR-10、CIFAR-100、ImageNet等多个数据集上超越现有方法,性能提升显著。同时,NCFM大幅节省资源,如在CIFAR-100上,每轮迭代时间比TESLA快29.4倍,GPU内存消耗仅为1/23.3。
本文第一作者王少博,现为上交大EPIC实验室博士生,导师张林峰,年仅27岁即成为博导。张林峰及其团队成员共同完成此研究。
原文链接
本文链接:https://kx.umi6.com/article/14689.html
转载请注明文章出处
相关推荐
.png)
换一换
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
2025-03-03 16:25:05
独家|阿里夸克“C计划”揭晓 上线对话助手 把“豆包”塞了进去
2025-10-23 10:05:55
OpenAI也来了,巨头为何决战AI浏览器?
2025-10-23 10:04:31
全国人大常委会法工委:网络安全法拟增加促进AI安全与发展内容
2025-10-23 18:13:26
百镜大战再添把火!阿里夸克AI眼镜即将开启预售
2025-10-23 15:12:35
研究发现:强迫AI大量阅读社交媒体垃圾帖 会造成不可逆的脑损伤
2025-10-22 23:54:44
沐曦集成科创板IPO上会在即 十余家上市公司互动易回复参股投资
2025-10-23 21:15:29
两部门:启动2025年度智能制造系统解决方案“揭榜挂帅”项目申报工作
2025-10-22 16:50:23
Meta AI大裁600人,亚历山大王操刀重点砍向LeCun团队
2025-10-23 09:59:56
小米汽车副总裁李肖爽否认宣传“SOS 1秒接通”:系造谣诋毁 将追责
2025-10-23 08:59:40
首个全国产!兆芯、联想开天联合打造AI教室:屏幕巧妙
2025-10-22 17:50:16
通用汽车放大招:谷歌AI助手明年上车+高级智驾将解放手眼
2025-10-23 01:55:15
《GTA6》电臀舞玩法被辟谣:网友瞎编的 结果谷歌AI全信了
2025-10-22 18:52:05
570 文章
273670 浏览
24小时热文
更多

-
2025-10-23 21:15:29
-
2025-10-23 20:16:19
-
2025-10-23 20:15:12