蒸馏 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

NuerIPS唯一满分论文曝光，来自清华上交

NuerIPS唯一满分论文曝光，来自清华上交近日，一篇来自清华大学和上海交通大学的论文在人工智能领域引发轰动，成为NuerIPS唯一获得满分评价的研究。这篇论文挑战了当前大模型推理能力提升的核心假设：真正决定推理上限的是基座模型本身，而非强化学习（RLVR）。研究还指出，蒸馏方法比强化学习更有望实...

原文链接

Oasis

11-11 17:16:47

NuerIPS

RLVR

蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

2025年10月，Thinking Machine发布了一项引发热议的研究成果，提出了一种结合强化学习和微调的创新方法——在线策略蒸馏（On-Policy Distillation）。该方法通过融合自主探索与密集监督，显著提升了小模型训练的性价比。实验表明，这种方法可将数学能力训练效率提升50-100倍，并有效解决AI‘灾难性遗忘’问题。例如，仅用150步训练便将8B小模型性能从60分提升至70分，计算成本降低9-30倍。此外，该技术还能在注入新知识的同时恢复通用能力，为AI终身学习提供了技术支持。研究由前OpenAI研究员Kevin Lu主导，目前已公开论文链接供进一步了解。

原文链接

元界筑梦师

10-28 10:41:47

在线策略蒸馏

小模型训练

强化学习

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek首次回应蒸馏OpenAI质疑：没有故意加入合成数据

2025年9月18日，DeepSeek团队在《Nature》封面发表论文，首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书，未故意加入合成数据，且数据截止时间为2024年7月，当时尚无先进推理模型发布，降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容，可能间接影响模型知识。研究采用纯强化学习框架，通过组相对策略优化算法，依据答案正确性给予奖励，促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为，DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。

原文链接

E-Poet

09-18 14:54:07

DeepSeek

OpenAI

蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

被曝蒸馏DeepSeek还造假！欧版OpenAI塌方了

2025年8月，欧洲版OpenAI——Mistral被曝其最新模型疑似蒸馏自DeepSeek，却伪装成强化学习成果并歪曲基准测试结果。爆料来自一名离职员工，揭露公司多项黑幕。今年6月已有博主通过‘语言指纹’分析发现Mistral-small-3.2与DeepSeek-v3高度相似，质疑为蒸馏结果。蒸馏虽非违规，但Mistral未公开此事实，被指误导公众。Mistral成立于2023年，估值已高达100亿美元，以开源和多语言处理能力闻名，近期发布新模型Mistral Medium V3.1，但官方对此事暂无回应。

原文链接

数字墨迹

08-14 16:57:45

DeepSeek

Mistral

蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

AI教父Hinton中国首次演讲实录：人类可能就是大语言模型

2025年7月26日，AI教父Geoffrey Hinton在中国首次发表演讲，探讨数字智能是否会取代生物智能。他回顾了AI发展的两种范式：符号主义与连接主义，并指出大语言模型的原理与人类语言理解方式类似，甚至认为人类可被视为一种大语言模型。Hinton强调AI在知识传播和复制上的优势，但也警示其潜在风险，呼吁全球合作确保AI安全。同场，MiniMax创始人闫俊杰分享了‘每个人的人工智能’主题，提出AI正在成为普惠工具，降低创意生产门槛，提升个人能力。他认为AI不会被少数公司垄断，而是通过开源和多模型架构实现普及化，未来AGI将属于全人类。

原文链接

量子思考者

07-26 17:44:18

AI普惠

大语言模型

知识蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

纯蒸馏模型 SOTA 出现！直接 SFT 成本直降 50 倍，数据已全部开源

标题：纯蒸馏模型 SOTA 突破！训练成本降低50倍，数据已开源 a-m-team 发布新论文，介绍下一代推理模型的小进展。团队基于 AM-Thinking-v1 数据通过“纯蒸馏”训练的学生模型，在多项高难度推理任务中接近甚至超越当前最优水平（SOTA），成本仅为传统方法的二十分之一。论文《...

原文链接

智能视野

05-22 11:30:40

SOTA

数据源

蒸馏模型

分享至

打开微信扫一扫

内容投诉

生成图片

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型克雷西 | 发自凹非寺量子位 | 公众号 QbitAI Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！ - 采用双模式架构，一个模型同时支持推理和非推理任务，自动切换。 - 训练和微调分段式策略，逐步构...

原文链接

AI思维矩阵

05-14 16:17:10

Qwen3

双模态

模型蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

CVPR满分论文：一块2080Ti搞定数据蒸馏，GPU占用仅2G，来自上交大“最年轻博导”课题组

CVPR满分论文：2080Ti搞定数据蒸馏，GPU仅需2G，出自上交大“最年轻博导”团队只要一块6年前的2080Ti，就能完成大模型数据蒸馏？来自上交大EPIC实验室等机构的研究提出一种新方法——NFCM，显存占用仅1/300，速度提升20倍，相关论文获CVPR满分。 NCFM引入辅助神经网络，将...

原文链接

AI幻想空间站

03-03 16:25:05

minmax优化

NFCM

数据蒸馏

分享至

打开微信扫一扫

内容投诉

生成图片

英特尔发布 OpenVINO 2025.0：新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔于2月14日发布了2025.0版本的OpenVINO工具套件，新增对图像生成模型FLUX.1的支持，可在CPU和GPU上通过GenAI流水线运行。该版本提升了生成式AI模型的性能，特别是针对图像生成模型进行了深度优化。新版本还增加了Image2Image和Inpainting功能，增强了结果的可控性和局部内容再生能力。此外，OpenVINO 2025.0版本首次实现了NPU加速支持，开发者可通过PyTorch的torch.compile接口调用英特尔NPU算力。英特尔表示正在努力支持更多最新模型，包括Mistral-7B-Instruct-v0.2和Qwen2.5。

原文链接