1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

CVPR满分论文:2080Ti搞定数据蒸馏,GPU仅需2G,出自上交大“最年轻博导”团队

只要一块6年前的2080Ti,就能完成大模型数据蒸馏?来自上交大EPIC实验室等机构的研究提出一种新方法——NFCM,显存占用仅1/300,速度提升20倍,相关论文获CVPR满分。

NCFM引入辅助神经网络,将数据集蒸馏转为minmax优化问题。在多个基准数据集上,NCFM展现高性能和可扩展性,仅需2GB GPU内存即可实现CIFAR数据集无损蒸馏。

核心是引入NCFD,通过交替优化合成数据和采样网络,提升合成数据质量和NCFD敏感性。NCFM在特征提取、频率参数采样、CF计算、NCFD度量及minmax优化等方面实现创新。

NCFM在CIFAR-10、CIFAR-100、ImageNet等多个数据集上超越现有方法,性能提升显著。同时,NCFM大幅节省资源,如在CIFAR-100上,每轮迭代时间比TESLA快29.4倍,GPU内存消耗仅为1/23.3。

本文第一作者王少博,现为上交大EPIC实验室博士生,导师张林峰,年仅27岁即成为博导。张林峰及其团队成员共同完成此研究。

原文链接
本文链接:https://kx.umi6.com/article/14689.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
2025-03-03 16:25:05
谷歌 DeepMind CEO 哈萨比斯:规模定律是走向通用人工智能的关键
2025-12-08 09:16:34
用 AI 合成死螃蟹视频骗退款 195 元,买家被行拘 8 日
2025-12-05 23:56:50
AI芯片明年6倍增长 百度回应昆仑芯上市计划:不保证会进行
2025-12-07 21:51:01
豆包手机助手:我们无法直接查询银行卡余额,需用户授权及手动确认
2025-12-06 17:41:12
华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升
2025-12-06 02:03:09
微博CEO王高飞谈AI手机:发微博功能待确认 主流应用操作存限制
2025-12-08 16:38:11
特斯拉 Optimus 人形机器人演示时摔倒,手忙脚乱“摘头显”露了馅
2025-12-08 15:33:43
AI眼镜取代不了手机,它想「干掉」传统眼镜
2025-12-08 12:26:26
联想天禧AI足球智能体正式上线,亮相咪咕世界杯抽签夜直播
2025-12-06 17:40:08
亚马逊CTO:开发者只要能进化绝不会被AI取代
2025-12-07 22:52:28
摩根大通CEO谈AI:使人们可以工作不那么辛苦 享受美好生活
2025-12-08 11:23:28
AI将冲击几乎所有工作!麦肯锡预测:全球高达8亿个岗位会被取代
2025-12-08 11:24:37
24小时热文
更多
扫一扫体验小程序