1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

CVPR满分论文:2080Ti搞定数据蒸馏,GPU仅需2G,出自上交大“最年轻博导”团队

只要一块6年前的2080Ti,就能完成大模型数据蒸馏?来自上交大EPIC实验室等机构的研究提出一种新方法——NFCM,显存占用仅1/300,速度提升20倍,相关论文获CVPR满分。

NCFM引入辅助神经网络,将数据集蒸馏转为minmax优化问题。在多个基准数据集上,NCFM展现高性能和可扩展性,仅需2GB GPU内存即可实现CIFAR数据集无损蒸馏。

核心是引入NCFD,通过交替优化合成数据和采样网络,提升合成数据质量和NCFD敏感性。NCFM在特征提取、频率参数采样、CF计算、NCFD度量及minmax优化等方面实现创新。

NCFM在CIFAR-10、CIFAR-100、ImageNet等多个数据集上超越现有方法,性能提升显著。同时,NCFM大幅节省资源,如在CIFAR-100上,每轮迭代时间比TESLA快29.4倍,GPU内存消耗仅为1/23.3。

本文第一作者王少博,现为上交大EPIC实验室博士生,导师张林峰,年仅27岁即成为博导。张林峰及其团队成员共同完成此研究。

原文链接
本文链接:https://kx.umi6.com/article/14689.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
CVPR满分论文:一块2080Ti搞定数据蒸馏,GPU占用仅2G,来自上交大“最年轻博导”课题组
2025-03-03 16:25:05
中国电科王平:国内半导体装备已进入“战国时代”
2025-09-05 21:27:41
OpenAI宣布推出AI在线招聘平台,和微软的领英打起来了
2025-09-05 10:16:42
机构:ChatGPT在印度实现强劲增长 8月下载量达1020万次
2025-09-05 09:15:57
OpenAI 明年杀入招聘市场,将帮助具备 AI 技能的人才找到工作
2025-09-05 16:21:28
华为AI模型运行专利公布
2025-09-05 15:25:04
港股机器人概念走强 行业商业化加速引发资本加注
2025-09-05 15:23:54
柯洁回应与AI下棋:比一百盘被虐一百盘 AI要我水平低的数据是在污染自己
2025-09-07 09:43:21
腾讯混元游戏 2.0 发布:图片秒变动画 / CG,全面开放使用
2025-09-05 17:21:54
黄仁勋的话白说了
2025-09-07 20:49:25
AI时代的平权假象
2025-09-05 08:14:05
还得继续砸钱,OpenAI 预计到 2029 年总支出或超千亿美元
2025-09-06 20:38:03
时空壶发布W4:用“硬核”技术,打赢一场AI 翻译的“标准”之战
2025-09-07 20:50:36
24小时热文
更多
扫一扫体验小程序