**摘要:** 10月21日,英伟达发布最新Normalized Transformer(nGPT)架构,显著提升AI模型训练效率。据科技媒体dataconomy报道,nGPT架构能在保持模型稳定性和准确性的同时,将训练时间缩短至原来的1/4或1/20。nGPT的核心技术是“超球面学习”,通过将嵌入、注意力矩阵和隐藏状态等关键组件映射到超球面上,确保模型各层在训练过程中保持平衡。该架构减少了训练步骤,摒弃了LayerNorm或RMSNorm等复杂归一化技术,简化了训练流程。英伟达团队在OpenWebText数据集上进行测试,结果显示nGPT在速度和效率上均优于传统GPT模型。此外,nGPT将归一化和表示学习结合成一个统一框架,简化了模型架构,便于扩展和适应更复杂的系统。未来,nGPT的方法有望应用于其他类型的模型和架构,推动AI技术的发展。 (本文基于10月22日发布的新闻内容整理)
原文链接
本文链接:https://kx.umi6.com/article/7651.html
转载请注明文章出处
相关推荐
换一换
Suno 承认使用版权音乐训练 AI 模型,“取经”学习不算侵权
2024-08-02 14:13:43
IBM 全新光学技术可缩短 GPU 闲置时间,大幅加快 AI 模型训练速度
2024-12-11 09:23:39
被索赔 500 万美元,OpenAI 遭 YouTube 主播集体诉讼:擅用其内容训练 AI
2024-08-06 13:31:21
Meta推出全新网络爬虫程序以训练AI模型
2024-08-21 22:16:32
Meta 承认使用澳大利亚 Facebook、Instagram 成年用户发布的公开内容训练 AI 模型
2024-09-15 11:58:00
摩尔线程发布Torch-MUSA v2.7.0 持续增强AI模型训练与推理支持
2025-11-28 11:28:30
Meta 恢复在欧盟使用用户公开数据训练 AI 模型,曾因隐私问题暂停
2025-04-15 09:23:26
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
2024-10-20 15:59:34
苹果:曾使用谷歌硬件来训练 Apple Intelligence 模型
2024-07-30 08:42:21
国家数据局:国内多数AI模型训练使用的中文数据占比已超60%
2025-08-21 15:37:53
英伟达新 nGPT 架构撬动 AI 未来:超球面学习提效,训练模型时间可缩短至 1/20
2024-10-22 11:00:45
微软旗下领英:将默认使用用户数据训练AI模型!
2025-09-24 15:47:40
亚马逊 AWS 展示 Project Rainier 分布式集群,有望成为最强 AI 模型训练计算机
2025-07-14 12:19:57
612 文章
397068 浏览
24小时热文
更多
-
2026-01-23 21:15:09 -
2026-01-23 21:14:01 -
2026-01-23 20:15:45