蒸馏 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

都让让！赛博女娲蒸馏一切，让乔布斯马斯克集体给你打工

标题：赛博女娲：让乔布斯、马斯克为你打工正文： Github上一个名为“女娲.skill”的项目近日爆火，短短一周收获超1万颗星。这个工具可以“蒸馏”任何人的思维方式和认知系统，只需输入名字，就能生成独立代码库供用户安装使用。 “女娲”不仅能模仿名人说话，还能提炼其心智模型、决策规则和价值...

原文链接

心智奇点

04-21 15:09:21

分享至

打开微信扫一扫

内容投诉

生成图片

美国AI巨头赤裸裸双标指控中国企业蒸馏后坦承自己蒸馏其他模型

4月17日，美国AI公司Anthropic被曝出双标行为。该公司此前指控中国AI企业通过蒸馏其大模型提升能力，但其最新发布的Claude Opus 4.7模型文档显示，该模型同样基于其他大模型的合成数据训练而成。这意味着Anthropic也采用了蒸馏技术，却未透露具体来源。蒸馏作为AI行业的常规操作，全球大模型训练普遍使用此方法。然而，Anthropic在取得领先地位后，联合谷歌、OpenAI等成立‘反蒸馏联盟’，并推动法案制裁相关中国企业。此前，Anthropic还因盗版书籍下载问题卷入法律纠纷，被判赔数亿美元。如今，他们试图将蒸馏作为打击竞争对手的借口，手段备受争议。

原文链接

超频思维站

04-17 18:15:38

分享至

打开微信扫一扫

内容投诉

生成图片

被网友吹上天的名人AI 一开口我就知道是个水货

2026年4月，名人AI数字分身（skill）在网络上引发热议。这些skill通过分析个人聊天记录、文档等内容生成对话模型，可模拟乔布斯、张雪峰等名人的语气和逻辑回答问题。尽管GitHub上的相关项目星标数迅速破千，但实际测试发现，这些AI仅能复述大众共识，缺乏深度与灵魂。例如，乔布斯.skill虽有其说话风格，但核心观点仅为科技媒体常见结论。此外，此类工具存在误导风险，如张雪峰.skill可能提供错误的高考志愿建议。专家指出，这类skill无法提取默会知识，只能模仿表面特征，更多是满足用户焦虑心理的‘止痛药’，而非真正的学习工具。

原文链接

代码编织者

04-16 00:30:35

分享至

打开微信扫一扫

内容投诉

生成图片

NuerIPS唯一满分论文曝光，来自清华上交

NuerIPS唯一满分论文曝光，来自清华上交近日，一篇来自清华大学和上海交通大学的论文在人工智能领域引发轰动，成为NuerIPS唯一获得满分评价的研究。这篇论文挑战了当前大模型推理能力提升的核心假设：真正决定推理上限的是基座模型本身，而非强化学习（RLVR）。研究还指出，蒸馏方法比强化学习更有望实...

原文链接

Oasis

11-11 17:16:47

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek首次回应蒸馏OpenAI质疑：没有故意加入合成数据

2025年9月18日，DeepSeek团队在《Nature》封面发表论文，首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书，未故意加入合成数据，且数据截止时间为2024年7月，当时尚无先进推理模型发布，降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容，可能间接影响模型知识。研究采用纯强化学习框架，通过组相对策略优化算法，依据答案正确性给予奖励，促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为，DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。

原文链接

E-Poet

09-18 14:54:07

分享至

打开微信扫一扫

内容投诉

生成图片

被曝蒸馏DeepSeek还造假！欧版OpenAI塌方了

2025年8月，欧洲版OpenAI——Mistral被曝其最新模型疑似蒸馏自DeepSeek，却伪装成强化学习成果并歪曲基准测试结果。爆料来自一名离职员工，揭露公司多项黑幕。今年6月已有博主通过‘语言指纹’分析发现Mistral-small-3.2与DeepSeek-v3高度相似，质疑为蒸馏结果。蒸馏虽非违规，但Mistral未公开此事实，被指误导公众。Mistral成立于2023年，估值已高达100亿美元，以开源和多语言处理能力闻名，近期发布新模型Mistral Medium V3.1，但官方对此事暂无回应。

原文链接

数字墨迹

08-14 16:57:45

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek「盗窃」OpenAI？更像是贼喊捉贼

2025年春节期间，AI初创公司DeepSeek发布的模型R1在全球范围内引发轰动，下载量突破2000万，用户数超过1亿。然而，DeepSeek因“盗窃”OpenAI数据的指控陷入争议。DeepSeek采用蒸馏技术，降低了训练成本，但遭质疑。蒸馏技术虽非抄袭，但可能导致模型同质化和幻觉问题。OpenAI指控DeepSeek违反模型使用条约，但缺乏具体证据。DeepSeek选择MIT开源协议，回应质疑。AI领域内，蒸馏技术并非罕见，而是近十年来的标准做法。DeepSeek的爆火带动了AI应用创新热潮，市场对此仍抱有期待。

原文链接

AI思维矩阵

02-12 11:23:22

分享至

打开微信扫一扫

内容投诉

生成图片

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

标题：成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏衡宇发自凹非寺量子位 | 公众号 QbitAI 成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能...

原文链接

AGI探路者

02-07 08:47:13

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI宣称DeepSeek违规“蒸馏”，但没有给出证据

OpenAI指控中国公司DeepSeek违规使用其专有模型进行“蒸馏”，但未提供具体证据。DeepSeek近期推出的新模型DeepSeek-R1在数学、编程和推理等领域表现优异，且训练成本远低于OpenAI的最新模型。此事引发市场波动，美股纳指周一跌超3%，英伟达跌近17%。OpenAI的服务条款禁止此类行为，目前正对DeepSeek进行调查。特朗普提名的白宫人工智能和加密货币总管大卫·萨克斯表示有证据支持OpenAI的指控，而美国官员则认为DeepSeek的行为涉及国家安全。

原文链接

Journeyman

01-30 10:25:54

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI：有证据表明 DeepSeek 使用了我们的模型进行训练

OpenAI指控中国公司DeepSeek涉嫌通过其API非法获取并使用OpenAI的AI模型进行训练。据彭博社报道，微软安全团队在2024年底发现DeepSeek关联账户导出了大量数据。OpenAI表示发现了DeepSeek使用“蒸馏”技术的证据，该技术能以低成本高效训练小型模型。OpenAI强调，利用输出数据构建竞争模型违反其服务条款。尽管如此，OpenAI并未透露具体证据细节。OpenAI在声明中表示，将采取措施保护其知识产权，并希望与美国政府合作防止先进技术被窃取。

原文链接