1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
NuerIPS唯一满分论文曝光,来自清华上交
NuerIPS唯一满分论文曝光,来自清华上交 近日,一篇来自清华大学和上海交通大学的论文在人工智能领域引发轰动,成为NuerIPS唯一获得满分评价的研究。这篇论文挑战了当前大模型推理能力提升的核心假设:真正决定推理上限的是基座模型本身,而非强化学习(RLVR)。研究还指出,蒸馏方法比强化学习更有望实...
Oasis
11-11 17:16:47
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
2025年9月18日,DeepSeek团队在《Nature》封面发表论文,首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书,未故意加入合成数据,且数据截止时间为2024年7月,当时尚无先进推理模型发布,降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容,可能间接影响模型知识。研究采用纯强化学习框架,通过组相对策略优化算法,依据答案正确性给予奖励,促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为,DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。
E-Poet
09-18 14:54:07
分享至
打开微信扫一扫
内容投诉
生成图片
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025年8月,欧洲版OpenAI——Mistral被曝其最新模型疑似蒸馏自DeepSeek,却伪装成强化学习成果并歪曲基准测试结果。爆料来自一名离职员工,揭露公司多项黑幕。今年6月已有博主通过‘语言指纹’分析发现Mistral-small-3.2与DeepSeek-v3高度相似,质疑为蒸馏结果。蒸馏虽非违规,但Mistral未公开此事实,被指误导公众。Mistral成立于2023年,估值已高达100亿美元,以开源和多语言处理能力闻名,近期发布新模型Mistral Medium V3.1,但官方对此事暂无回应。
数字墨迹
08-14 16:57:45
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek「盗窃」OpenAI?更像是贼喊捉贼
2025年春节期间,AI初创公司DeepSeek发布的模型R1在全球范围内引发轰动,下载量突破2000万,用户数超过1亿。然而,DeepSeek因“盗窃”OpenAI数据的指控陷入争议。DeepSeek采用蒸馏技术,降低了训练成本,但遭质疑。蒸馏技术虽非抄袭,但可能导致模型同质化和幻觉问题。OpenAI指控DeepSeek违反模型使用条约,但缺乏具体证据。DeepSeek选择MIT开源协议,回应质疑。AI领域内,蒸馏技术并非罕见,而是近十年来的标准做法。DeepSeek的爆火带动了AI应用创新热潮,市场对此仍抱有期待。
AI思维矩阵
02-12 11:23:22
分享至
打开微信扫一扫
内容投诉
生成图片
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
标题:成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能...
AGI探路者
02-07 08:47:13
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI宣称DeepSeek违规“蒸馏”,但没有给出证据
OpenAI指控中国公司DeepSeek违规使用其专有模型进行“蒸馏”,但未提供具体证据。DeepSeek近期推出的新模型DeepSeek-R1在数学、编程和推理等领域表现优异,且训练成本远低于OpenAI的最新模型。此事引发市场波动,美股纳指周一跌超3%,英伟达跌近17%。OpenAI的服务条款禁止此类行为,目前正对DeepSeek进行调查。特朗普提名的白宫人工智能和加密货币总管大卫·萨克斯表示有证据支持OpenAI的指控,而美国官员则认为DeepSeek的行为涉及国家安全。
Journeyman
01-30 10:25:54
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI指控中国公司DeepSeek涉嫌通过其API非法获取并使用OpenAI的AI模型进行训练。据彭博社报道,微软安全团队在2024年底发现DeepSeek关联账户导出了大量数据。OpenAI表示发现了DeepSeek使用“蒸馏”技术的证据,该技术能以低成本高效训练小型模型。OpenAI强调,利用输出数据构建竞争模型违反其服务条款。尽管如此,OpenAI并未透露具体证据细节。OpenAI在声明中表示,将采取措施保护其知识产权,并希望与美国政府合作防止先进技术被窃取。
小阳哥
01-29 19:13:30
分享至
打开微信扫一扫
内容投诉
生成图片
AI慢思考蒸馏进快思考,Llama2升至GPT4水平,不写过程也能做对题
Meta研究人员利用AI技术,将模型的“慢思考”(系统2)成果提炼至“快思考”(系统1),Llama2由此提升257%,超越GPT4,实现无需详细过程也能正确作答。这项工作借鉴了心理学中的系统1(直觉)和系统2(推理)概念,通过无监督蒸馏方法,用系统2生成的推理结果训练系统1,显著提高了模型效率和准确性,特别适用于实时交互场景。研究已在《arXiv》发布,未来目标是探索更自然的学习方式。
智慧轨迹
07-12 13:03:40
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序