正文:2026年3月,普林斯顿大学联合团队发布研究指出,英伟达Blackwell B200 GPU因软硬件适配问题浪费60%算力。团队推出FlashAttention-4算法,通过三大优化策略将GPU利用率提升至71%,较行业普遍的20%-30%显著改善。该算法采用软件模拟指数函数、条件性softmax rescaling等技术,破解了B200核心算力与配套单元脱节的瓶颈。此外,FlashAttention-4基于Python框架开发,编译速度较前代提升30倍,并在长序列处理等场景中性能突出。研究还透露,英伟达cuDNN 9.13版本已吸收其核心技术。
原文链接
本文链接:https://kx.umi6.com/article/33860.html
转载请注明文章出处
相关推荐
换一换
英伟达最强B200算力浪费60%!普林斯顿团队出手,利用率升至71%
2026-03-18 08:54:56
黄仁勋:OpenClaw“绝对是下一个ChatGPT”
2026-03-18 08:58:01
天下苦「调参」久矣!MIT师生推出全新RandOpt算法
2026-03-16 16:07:29
华为面向AI推理场景发布新一代AI数据基础设施
2026-03-17 15:43:39
从“养虾热”到实体交互:元萝卜推动OpenClaw走向真实世界
2026-03-17 21:06:28
1.4亿宝可梦玩家,都在给AI免费打工…
2026-03-16 13:58:50
Thoma Bravo联创:一些软件公司在抛售潮中遭受了“不合理的”打击
2026-03-18 09:00:10
AI安全引关注 网络安全建设待升级
2026-03-17 08:14:05
2026年世界互联网大会亚太峰会下月在香港召开
2026-03-17 11:28:07
北京:促进数据要素流通使用 开展公共数据授权运营使用
2026-03-17 13:36:53
均普智能在无锡成立机器人公司
2026-03-16 11:54:47
一手实测首个龙虾模型:长路径任务不失误,一人包揽全栈开发
2026-03-16 16:09:58
XR公司VITURE与英伟达等推出XR-AI解决方案
2026-03-17 11:26:59
695 文章
497529 浏览
24小时热文
更多
-
2026-03-18 10:02:29 -
2026-03-18 09:01:16 -
2026-03-18 09:00:10