【快科技10月20日报道】NVIDIA最新研究可能彻底改变AI的未来。其研究团队开发出一种名为“归一化Transformer”(nGPT)的新型神经网络架构,该架构在超球面上进行表示学习,显著提升了大型语言模型(LLM)的训练速度,最高可提升20倍,同时保持了模型的精度。nGPT架构的核心是将所有向量归一化为单位范数,使得输入的token在超球面表面上移动,每一层模型通过位移贡献最终的输出预测。实验显示,nGPT在不同序列长度下的训练速度显著提高:在1k上下文中提高4倍,在4k上下文中提高10倍,在8k上下文中提高20倍。此技术不仅能大幅提升训练速度,还增强了模型的稳定性。 (注:摘要内容约200字)
原文链接
本文链接:https://kx.umi6.com/article/7574.html
转载请注明文章出处
相关推荐
换一换
英伟达新 nGPT 架构撬动 AI 未来:超球面学习提效,训练模型时间可缩短至 1/20
2024-10-22 11:00:45
中科创达与吉利汽车集团、NVIDIA联合打造创新产品AIBOX
2025-09-10 08:33:06
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍
2025-09-13 17:30:05
仅70W功耗!NVIDIA RTX PRO迎来两款半高新产品:还有全新服务器
2025-08-12 12:20:28
NVIDIA市值两日蒸发超1.4万亿元!退居全球市值第三
2024-06-23 10:29:29
逼近40000亿美元!NVIDIA距史上最高市值公司仅一步之遥
2025-07-04 15:50:54
NVIDIA AI芯片成“新黄金”!市值全球首超4万亿美元只是开始
2025-07-10 10:16:41
吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf记录居第一
2025-04-03 12:18:44
AI泡沫再遭质疑:NVIDIA、谷歌、特斯拉等科技巨头跳水
2025-11-14 22:20:05
NVIDIA新动作:RTX 50显卡被删除AI相关宣传
2025-09-21 11:42:24
无惧ASIC竞争!黄仁勋:全球没几个团队能追上NVIDIA
2025-11-21 18:38:53
超17万个视频!NVIDIA、苹果等巨头被曝违规用数据训练AI
2024-07-17 18:07:53
NVIDIA未来将达10万亿美元市值:GPU血赚 利润将达3750亿美元
2025-10-26 21:28:42
668 文章
470921 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55