1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

**摘要:** 10月21日,英伟达发布最新Normalized Transformer(nGPT)架构,显著提升AI模型训练效率。据科技媒体dataconomy报道,nGPT架构能在保持模型稳定性和准确性的同时,将训练时间缩短至原来的1/4或1/20。nGPT的核心技术是“超球面学习”,通过将嵌入、注意力矩阵和隐藏状态等关键组件映射到超球面上,确保模型各层在训练过程中保持平衡。该架构减少了训练步骤,摒弃了LayerNorm或RMSNorm等复杂归一化技术,简化了训练流程。英伟达团队在OpenWebText数据集上进行测试,结果显示nGPT在速度和效率上均优于传统GPT模型。此外,nGPT将归一化和表示学习结合成一个统一框架,简化了模型架构,便于扩展和适应更复杂的系统。未来,nGPT的方法有望应用于其他类型的模型和架构,推动AI技术的发展。 (本文基于10月22日发布的新闻内容整理)

原文链接
本文链接:https://kx.umi6.com/article/7651.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
被索赔 500 万美元,OpenAI 遭 YouTube 主播集体诉讼:擅用其内容训练 AI
2024-08-06 13:31:21
IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
2024-12-11 09:23:39
国家数据局:国内多数AI模型训练使用的中文数据占比已超60%
2025-08-21 15:37:53
OpenAI被曝打造社交网络 数据或将反哺AI模型训练
2025-04-16 03:49:42
苹果:曾使用谷歌硬件来训练 Apple Intelligence 模型
2024-07-30 08:42:21
亚马逊 AWS 展示 Project Rainier 分布式集群,有望成为最强 AI 模型训练计算机
2025-07-14 12:19:57
Meta 推出 SPDL 工具:突破训练 AI 模型数据效率瓶颈,吞吐量提升 2-3 倍
2024-12-10 14:56:44
英伟达新 nGPT 架构撬动 AI 未来:超球面学习提效,训练模型时间可缩短至 1/20
2024-10-22 11:00:45
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
2024-10-20 15:59:34
Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停
2025-04-15 09:23:26
Meta 证实:Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型
2024-10-09 11:09:34
为训练 AI 模型 Claude,Anthropic 耗资数百万美元购入并“销毁”巨量图书
2025-06-26 07:54:56
Meta 承认使用澳大利亚 Facebook、Instagram 成年用户发布的公开内容训练 AI 模型
2024-09-15 11:58:00
24小时热文
更多
扫一扫体验小程序