模型训练 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

AI看图不准？「一拉一推」让模型看得全又准｜微软x清华视觉-语言模型（VLM）的推理能力虽强，但常因“看错”而得出错误答案。问题不在于推理不足，而是模型未能精准聚焦关键视觉证据。现有方法多依赖推理阶段的外部提示，如生成视觉线索或调用工具，但这些方法存在局限：线索形式受限、任务依赖性强且效率低。...

原文链接

GhostPilot

02-08 15:11:38

BiPS

模型训练

视觉证据

分享至

打开微信扫一扫

内容投诉

生成图片

现有路径不通？OpenAI、亚马逊考虑改变大模型训练方式

2026年1月，OpenAI、亚马逊等机构正探讨改变大模型训练方式，放弃‘先预训练、后微调’的传统流程，转而针对特定任务早期引入精选数据。这一方法由亚马逊的David Luan等人倡导，旨在提升效率并解决‘裂脑问题’。若实施，将推动AI行业从通用模型转向专用模型开发，并对数据筛选和团队组织提出更高要求。目前，OpenAI已通过路由技术和专用版本（如GPT-5-Codex）应对需求分化，未来可能彻底重组研究团队。此外，硬件领域创新加速，光子芯片公司Neurophos获1.1亿美元融资，目标2028年推出比英伟达快50倍的芯片。OpenAI的定制推理芯片也进入‘流片’阶段，Stargate项目进展超预期。行业并购活跃，苹果与谷歌谈判合作，英伟达CEO计划访华，Anthropic发布新版Claude‘宪法’，白宫预测生成式AI将显著推动经济增长。

原文链接

AI奇点纪元

01-27 12:08:17

专用模型

大模型训练

硬件创新

分享至

打开微信扫一扫

内容投诉

生成图片

国家网信办：利用合成数据进行模型训练和关键能力优化时应当评估合成数据安全性

12月27日，国家互联网信息办公室发布《人工智能拟人化互动服务管理暂行办法（征求意见稿）》，向社会公开征求意见。意见稿要求，利用合成数据进行模型训练和优化时需评估数据安全性，并加强训练数据管理。具体包括：使用符合社会主义核心价值观的数据集；清洗、标注数据以增强透明度和可靠性；提高数据多样性，防范生成内容风险；保障数据来源合法且可追溯；采取措施防止数据泄露。同时，强调定期检查和迭代升级数据，持续优化产品性能。

原文链接

AI创想团

12-27 15:42:08

合成数据

数据安全

模型训练

分享至

打开微信扫一扫

内容投诉

生成图片

双非大学生，涌入大厂AI流水线

2025年，非北上广深、非985高校的大学生涌入大厂AI数据标注流水线，从事基础性兼职工作。他们通过抢单完成图片标注、文本纠错等任务，月收入约1000-2000元。这些学生分散在成都、郑州、武汉等地，利用课余时间参与AI训练，试图借此积累经验、提升简历竞争力。尽管工作琐碎且收入有限，部分学生认为这是通往AI领域的敲门砖，如郑州某高校学生张莹凭借相关经历获得头部教培机构实习机会。然而，随着兼职平台竞争加剧，抢单难度增加，收入吸引力下降。与此同时，AI技术快速发展带来的就业焦虑也推动更多学生加入这一浪潮，成为智能时代庞大流水线上的一员。

原文链接

代码编织者

12-04 18:35:49

AI兼职

双非大学生

大模型训练

分享至

打开微信扫一扫

内容投诉

生成图片

又买一家：OpenAI 将收购 Neptune，强化 AI 模型训练监控能力

12月4日，OpenAI宣布达成协议收购Neptune，一家专注于AI模型训练监控与调试工具的初创公司。Neptune曾与OpenAI合作开发指标仪表盘，此次收购将深化双方协作，将其技术集成至OpenAI的训练技术栈中。Neptune CEO透露，未来几个月公司将逐步停止对外服务，具体交易条款未披露。今年以来，OpenAI已完成多起收购，包括10月的Software Applications Incorporated、9月的Statsig（11亿美元），以及5月的io（超60亿美元）。Neptune此前已融资超1800万美元，投资方包括Almaz Capital等。CEO表示感谢支持者，并称这是一段难忘旅程的开始。

原文链接

代码编织者

12-04 09:11:05

AI模型训练监控

Neptune

OpenAI

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI将收购AI模型训练工具初创公司Neptune

12月4日，OpenAI宣布已达成收购AI模型训练工具初创公司Neptune的最终协议。Neptune专注于为AI公司提供模型训练过程监控与调试工具，其技术已被OpenAI使用超一年，用于实验和模型版本比较。Neptune首席执行官透露，未来几个月将逐步减少对外服务。OpenAI首席科学Jakub Pachocki表示，Neptune的快速精准系统能帮助研究人员深入分析复杂训练工作流，未来将深度集成到OpenAI的技术栈中，以更清晰洞察模型学习过程。此次收购将加强双方协作，进一步提升AI模型训练效率。

原文链接

虚拟微光

12-04 05:01:41

Neptune

OpenAI

模型训练工具

分享至

打开微信扫一扫

内容投诉

生成图片

摩尔线程发布Torch-MUSA v2.7.0 持续增强AI模型训练与推理支持

11月28日，摩尔线程发布PyTorch深度学习框架的MUSA扩展库Torch-MUSA v2.7.0。新版本在功能集成、性能优化和硬件支持方面取得突破，进一步增强AI模型训练与推理能力。这是Torch-MUSA在短短一个月内连续完成的第二次更新，此前已发布v2.5.0版本。此次快速迭代展现了摩尔线程在MUSA生态建设上的持续投入和技术实力，为开发者提供更高效的工具支持。

原文链接

未来笔触

11-28 11:28:30

AI模型训练

Torch-MUSA

摩尔线程

分享至

打开微信扫一扫

内容投诉

生成图片

Thinking Machine新研究刷屏！结合RL+微调，小模型训练更具性价比

2025年10月，Thinking Machine发布了一项引发热议的研究成果，提出了一种结合强化学习和微调的创新方法——在线策略蒸馏（On-Policy Distillation）。该方法通过融合自主探索与密集监督，显著提升了小模型训练的性价比。实验表明，这种方法可将数学能力训练效率提升50-100倍，并有效解决AI‘灾难性遗忘’问题。例如，仅用150步训练便将8B小模型性能从60分提升至70分，计算成本降低9-30倍。此外，该技术还能在注入新知识的同时恢复通用能力，为AI终身学习提供了技术支持。研究由前OpenAI研究员Kevin Lu主导，目前已公开论文链接供进一步了解。

原文链接

元界筑梦师

10-28 10:41:47

在线策略蒸馏

小模型训练

强化学习

分享至

打开微信扫一扫

内容投诉

生成图片

AI 导致维基百科人类访问量显著下降，运营方疾呼“危险”

2025年10月17日，维基媒体基金会警告称，AI技术导致维基百科人类访问量显著下降，过去几个月页面浏览量同比减少8%。运营方表示，生成式AI聊天机器人和搜索引擎通过总结内容分流了流量，威胁到平台的长期可持续发展。维基媒体基金会高级总监Marshall Miller指出，虽然AI模型普遍依赖维基百科数据进行训练，但访问量下降可能削弱志愿者贡献和内容更新速度，同时影响个人捐赠支持。他呼吁用户支持人工整理的知识，强调查看原始来源和传播可信信息的重要性，以应对AI对信息获取方式的深远影响。

原文链接

数据炼金师

10-17 16:22:38

AI模型训练

维基百科

访问量下降

分享至

打开微信扫一扫

内容投诉

生成图片

微软旗下领英：将默认使用用户数据训练AI模型！

微软旗下领英宣布，从2025年11月3日起将默认使用用户数据训练AI模型，以优化算法和改进AI功能。此次训练涵盖所有用户，包括欧洲经济区、英国和瑞士的用户。领英将利用公开资料和帖子数据，用于如“使用AI重写”等功能，但私人消息或帖子不会被使用。值得注意的是，生成式AI改进功能默认开启，用户需手动关闭相关设置以避免数据被使用。关闭步骤为：进入设置>数据隐私>生成式AI改进，关闭对应开关。此政策引发用户对隐私的关注，用户可自行选择是否参与数据训练。

原文链接

未来笔触

09-24 15:47:40

AI模型训练

用户数据

领英

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多