AI模型训练 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

又买一家：OpenAI 将收购 Neptune，强化 AI 模型训练监控能力

12月4日，OpenAI宣布达成协议收购Neptune，一家专注于AI模型训练监控与调试工具的初创公司。Neptune曾与OpenAI合作开发指标仪表盘，此次收购将深化双方协作，将其技术集成至OpenAI的训练技术栈中。Neptune CEO透露，未来几个月公司将逐步停止对外服务，具体交易条款未披露。今年以来，OpenAI已完成多起收购，包括10月的Software Applications Incorporated、9月的Statsig（11亿美元），以及5月的io（超60亿美元）。Neptune此前已融资超1800万美元，投资方包括Almaz Capital等。CEO表示感谢支持者，并称这是一段难忘旅程的开始。

原文链接

代码编织者

12-04 09:11:05

AI模型训练监控

Neptune

OpenAI

分享至

打开微信扫一扫

内容投诉

生成图片

摩尔线程发布Torch-MUSA v2.7.0 持续增强AI模型训练与推理支持

11月28日，摩尔线程发布PyTorch深度学习框架的MUSA扩展库Torch-MUSA v2.7.0。新版本在功能集成、性能优化和硬件支持方面取得突破，进一步增强AI模型训练与推理能力。这是Torch-MUSA在短短一个月内连续完成的第二次更新，此前已发布v2.5.0版本。此次快速迭代展现了摩尔线程在MUSA生态建设上的持续投入和技术实力，为开发者提供更高效的工具支持。

原文链接

未来笔触

11-28 11:28:30

AI模型训练

Torch-MUSA

摩尔线程

分享至

打开微信扫一扫

内容投诉

生成图片

AI 导致维基百科人类访问量显著下降，运营方疾呼“危险”

2025年10月17日，维基媒体基金会警告称，AI技术导致维基百科人类访问量显著下降，过去几个月页面浏览量同比减少8%。运营方表示，生成式AI聊天机器人和搜索引擎通过总结内容分流了流量，威胁到平台的长期可持续发展。维基媒体基金会高级总监Marshall Miller指出，虽然AI模型普遍依赖维基百科数据进行训练，但访问量下降可能削弱志愿者贡献和内容更新速度，同时影响个人捐赠支持。他呼吁用户支持人工整理的知识，强调查看原始来源和传播可信信息的重要性，以应对AI对信息获取方式的深远影响。

原文链接

数据炼金师

10-17 16:22:38

AI模型训练

维基百科

访问量下降

分享至

打开微信扫一扫

内容投诉

生成图片

微软旗下领英：将默认使用用户数据训练AI模型！

微软旗下领英宣布，从2025年11月3日起将默认使用用户数据训练AI模型，以优化算法和改进AI功能。此次训练涵盖所有用户，包括欧洲经济区、英国和瑞士的用户。领英将利用公开资料和帖子数据，用于如“使用AI重写”等功能，但私人消息或帖子不会被使用。值得注意的是，生成式AI改进功能默认开启，用户需手动关闭相关设置以避免数据被使用。关闭步骤为：进入设置>数据隐私>生成式AI改进，关闭对应开关。此政策引发用户对隐私的关注，用户可自行选择是否参与数据训练。

原文链接

未来笔触

09-24 15:47:40

AI模型训练

用户数据

领英

分享至

打开微信扫一扫

内容投诉

生成图片

国家数据局：国内多数AI模型训练使用的中文数据占比已超60%

财联社8月21日电，国家数据局最新数据显示，国内多数AI模型训练中使用的中文数据占比已超60%，部分模型甚至达到80%。这表明中文高质量数据的开发与供给能力显著增强，为我国人工智能模型性能的快速提升提供了有力支撑。这一进展凸显了我国在AI领域的技术进步和数据资源优势，也为未来人工智能产业的进一步发展奠定了坚实基础。

原文链接

AGI探路者

08-21 15:37:53

AI模型训练

中文数据

国家数据局

分享至

打开微信扫一扫

内容投诉

生成图片

亚马逊 AWS 展示 Project Rainier 分布式集群，有望成为最强 AI 模型训练计算机

7月14日，亚马逊AWS发布介绍其分布式集群Project Rainier，该项目有望成为全球最强AI模型训练计算机。Project Rainier基于Annapurna Labs开发的Trainium2芯片，每个服务器配备16颗芯片，每4个服务器组成一个UltraServer，数以万计的UltraServer通过NeuronLinks和Elastic Fabric Adapter技术互联，构成超级集群。该系统分布于美国多个数据中心，具备跨中心协作能力。Anthropic将利用Project Rainier训练下一代Claude模型，其算力可达Anthropic当前最大训练集群的五倍，为AI模型研发提供强大支持。

原文链接

心智奇点

07-14 12:19:57

AI模型训练

Project Rainier

Trainium2

分享至

打开微信扫一扫

内容投诉

生成图片

为训练 AI 模型 Claude，Anthropic 耗资数百万美元购入并“销毁”巨量图书

6月26日，据外媒报道，人工智能公司Anthropic为训练AI模型Claude，耗资数百万美元购入并销毁大量实体图书，将书籍拆解、扫描后丢弃原件。法庭文件显示，公司曾雇佣前Google Books项目负责人Tom Turvey，试图复制谷歌的图书数字化模式。法官William Alsup裁定该行为构成合理使用，因图书已合法购买、扫描后即刻销毁，且数字文件仅限内部使用。AI训练需要海量优质文本，而书籍相比网络内容更具质量优势。Anthropic最初尝试绕过版权，后转向购买二手书进行破坏式扫描，以规避法律风险。

原文链接

WisdomTrail

06-26 07:54:56

AI模型训练

合理使用

图书销毁

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI被曝打造社交网络数据或将反哺AI模型训练

据财联社4月16日报道，人工智能公司OpenAI正开发类似X（原推特）的社交网络项目，目前处于早期阶段，原型侧重于ChatGPT的图像生成功能及社交动态信息流。CEO奥尔特曼已向外部人士咨询反馈，但具体推出方式未定。此计划可能加剧与马斯克的关系，后者曾试图以974亿美元控股OpenAI，遭拒后成立xAI竞争。近期，双方因合同纠纷互相诉讼。若OpenAI推出社交网络，将与Meta直接竞争，后者也在开发类似功能。此外，社交数据可增强AI模型训练能力，OpenAI或借此获取专属数据资源。尽管项目前景待观察，但显示其扩展业务的新方向。

原文链接

代码编织者Nexus

04-16 03:49:42

AI模型训练

OpenAI

社交网络

分享至

打开微信扫一扫

内容投诉

生成图片

Meta 恢复在欧盟使用用户公开数据训练 AI 模型，曾因隐私问题暂停

Meta公司宣布从本周起恢复在欧盟使用Facebook和Instagram上的公共内容（如帖子和评论）训练AI模型。此前，由于GDPR隐私法规限制，Meta在欧盟的AI项目进展滞后。2024年6月，因爱尔兰数据保护委员会（DPC）反对，Meta暂停了相关计划。近期，在欧洲数据保护委员会（EDPB）确认其方法合规后，Meta与DPC达成共识，决定重启训练工作。欧盟用户将收到通知，可选择通过表格拒绝数据使用。Meta强调，不会使用私人消息或18岁以下用户数据进行训练，并效仿谷歌、OpenAI的做法。此外，DPC仍在审查其他AI训练案例，如xAI对Grok的训练。

原文链接

像素宇宙

04-15 09:23:26

AI模型训练

GDPR