1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
亚马逊 AWS 展示 Project Rainier 分布式集群,有望成为最强 AI 模型训练计算机
7月14日,亚马逊AWS发布介绍其分布式集群Project Rainier,该项目有望成为全球最强AI模型训练计算机。Project Rainier基于Annapurna Labs开发的Trainium2芯片,每个服务器配备16颗芯片,每4个服务器组成一个UltraServer,数以万计的UltraServer通过NeuronLinks和Elastic Fabric Adapter技术互联,构成超级集群。该系统分布于美国多个数据中心,具备跨中心协作能力。Anthropic将利用Project Rainier训练下一代Claude模型,其算力可达Anthropic当前最大训练集群的五倍,为AI模型研发提供强大支持。
心智奇点
07-14 12:19:57
AI模型训练
Project Rainier
Trainium2
分享至
打开微信扫一扫
内容投诉
生成图片
7B模型对标GPT-4o,全球首个医疗代码生成大模型训练平台来了
2025年7月,埃默里大学、佐治亚理工学院等联合发布全球首个医疗代码生成大模型训练平台MedAgentGym。该平台整合72,413个真实医疗编程任务,覆盖电子健康记录查询、生物信息学建模等四大领域,并提供容器化隔离环境与交互式反馈机制。基于此平台开发的开源模型Med-Copilot-7B通过两阶段训练后,在多项医疗编程任务上性能接近GPT-4o,达到59.90分。研究团队还引入AI验证器,显著提升模型成功率至42%,为未来医疗AI发展奠定基础。论文及代码已公开,项目有望加速医疗AI普惠化进程。
AGI探路者
07-13 13:05:04
MedAgentGym
医疗代码生成
大模型训练平台
分享至
打开微信扫一扫
内容投诉
生成图片
为训练 AI 模型 Claude,Anthropic 耗资数百万美元购入并“销毁”巨量图书
6月26日,据外媒报道,人工智能公司Anthropic为训练AI模型Claude,耗资数百万美元购入并销毁大量实体图书,将书籍拆解、扫描后丢弃原件。法庭文件显示,公司曾雇佣前Google Books项目负责人Tom Turvey,试图复制谷歌的图书数字化模式。法官William Alsup裁定该行为构成合理使用,因图书已合法购买、扫描后即刻销毁,且数字文件仅限内部使用。AI训练需要海量优质文本,而书籍相比网络内容更具质量优势。Anthropic最初尝试绕过版权,后转向购买二手书进行破坏式扫描,以规避法律风险。
WisdomTrail
06-26 07:54:56
AI模型训练
合理使用
图书销毁
分享至
打开微信扫一扫
内容投诉
生成图片
阿里云推出AI加速框架 模型训练时间缩短50%
《科创板日报》23日消息,阿里云发布全新AI加速框架PAI-TurboX,专为自动驾驶领域模型设计。该框架通过优化训练和推理过程,显著提升感知、规划控制及世界模型的效率。据测试显示,在多种行业模型训练任务中,PAI-TurboX能将训练时间平均缩短50%,大幅提高研发效率。此技术突破将助力自动驾驶等行业加速技术创新与落地应用。
代码编织者Nexus
06-23 16:27:28
AI加速框架
模型训练
阿里云
分享至
打开微信扫一扫
内容投诉
生成图片
全新GPU高速互联设计,为大模型训练降本增效!北大/阶跃/曦智提出新一代高带宽域架构
全新GPU高速互联设计助力大模型训练降本增效!北大/阶跃/曦智提出InfiniteHBD架构 随着大模型参数规模扩大,分布式训练成为AI发展核心路径。高带宽域设计对提升训练效率至关重要,但现有HBD架构在可扩展性、成本和容错能力等方面存在瓶颈。NVIDIA NVL-72等以交换机为中心的HBD成...
WisdomTrail
05-19 15:17:11
GPU高速互联
InfiniteHBD
大模型训练
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI被曝打造社交网络 数据或将反哺AI模型训练
据财联社4月16日报道,人工智能公司OpenAI正开发类似X(原推特)的社交网络项目,目前处于早期阶段,原型侧重于ChatGPT的图像生成功能及社交动态信息流。CEO奥尔特曼已向外部人士咨询反馈,但具体推出方式未定。此计划可能加剧与马斯克的关系,后者曾试图以974亿美元控股OpenAI,遭拒后成立xAI竞争。近期,双方因合同纠纷互相诉讼。若OpenAI推出社交网络,将与Meta直接竞争,后者也在开发类似功能。此外,社交数据可增强AI模型训练能力,OpenAI或借此获取专属数据资源。尽管项目前景待观察,但显示其扩展业务的新方向。
代码编织者Nexus
04-16 03:49:42
AI模型训练
OpenAI
社交网络
分享至
打开微信扫一扫
内容投诉
生成图片
Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停
Meta公司宣布从本周起恢复在欧盟使用Facebook和Instagram上的公共内容(如帖子和评论)训练AI模型。此前,由于GDPR隐私法规限制,Meta在欧盟的AI项目进展滞后。2024年6月,因爱尔兰数据保护委员会(DPC)反对,Meta暂停了相关计划。近期,在欧洲数据保护委员会(EDPB)确认其方法合规后,Meta与DPC达成共识,决定重启训练工作。欧盟用户将收到通知,可选择通过表格拒绝数据使用。Meta强调,不会使用私人消息或18岁以下用户数据进行训练,并效仿谷歌、OpenAI的做法。此外,DPC仍在审查其他AI训练案例,如xAI对Grok的训练。
像素宇宙
04-15 09:23:26
AI模型训练
GDPR
Meta
分享至
打开微信扫一扫
内容投诉
生成图片
杨立昆最新访谈:用于训练AI模型的资源,远没有到尽头
标题:杨立昆最新访谈:用于训练AI模型的资源,远没有到尽头 Meta首席AI科学家杨立昆近期接受专访,探讨了深度学习的发展历程、机器学习的三种范式、莫拉维克悖论与AI发展的限制、训练AI模型的资源、AI基础设施投资等话题。 杨立昆指出,当前AI发展的三大限制包括物理世界复杂性、莫拉维克悖论(计算机擅...
数据炼金师
03-10 11:34:42
AI模型训练资源
自监督学习
莫拉维克悖论
分享至
打开微信扫一扫
内容投诉
生成图片
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当
微软推出首个FP4训练框架,实现与BF16相当的训练效果,所需存储和计算资源更少。该框架适用于高达130亿参数规模的模型,训练Token数量达千亿级别。研究团队在FP8 TensorCore上模拟FP4,采用定制化FP4矩阵乘法CUDA内核,通过E2M1格式(2位指数,1位尾数,1位符号位)实现高效量化。此框架对权重矩阵W和激活矩阵A采取不同粒度的量化策略,最大化利用FP4加速效果。为解决梯度问题,研究团队提出可微分梯度估计方法,并引入“离群点削峰和补偿”策略。该框架由微软亚洲研究院和SIGMA团队打造,第一作者Ruizhe Wang是中科大在读博士生,通讯作者为MSRA的程鹏和Yeyun Gong。
量子思考者
01-30 13:29:24
FP4训练框架
大模型训练
微软
分享至
打开微信扫一扫
内容投诉
生成图片
上海第一批自动驾驶大模型训练数据采集车正式发车
12月31日,上海高级别自动驾驶引领区数据采集车发车仪式在浦东举行,30辆智己L6数据采集车正式发车。市经济信息化委副主任汤文侃表示,上海将按照“单车智能为基础,车路云协同为关键支撑”的技术路线,推动智能网联汽车产业生态培育。主要措施包括开展车端真实训练数据采集与处理,建设自动驾驶实训场平台,以及构建车联通信网络。首批数据采集车的发车标志着上海在自动驾驶领域迈出了重要一步。
智能维度跳跃
12-31 20:48:59
大模型训练
数据采集
自动驾驶
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序