斯坦福大学的研究团队意外发现,通过AI生成的CUDA内核在性能上显著超越了PyTorch优化的内核。例如,二维卷积性能达到PyTorch的179.9%,层归一化性能更是提升了484.4%。这项研究由华人学者Anne Ouyang、Azalia Mirhoseini及Percy Liang主导,原本目标是生成数据训练内核生成模型,但测试阶段生成的数据本身却意外表现出色。团队采用多分支探索策略,结合语言推理,使AI在每次迭代中产生多样化的优化方案。此方法不仅展现了AI强大的推理能力,还表明无需大规模再训练,巧妙的搜索策略也能解决复杂问题。尽管仍存在优化空间,如FP16 Matmul和Flash Attention性能仍有提升余地,但研究团队对未来充满信心。该成果近期发布,引发了广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/19553.html
转载请注明文章出处
相关推荐
换一换
斯坦福意外用AI生成超强CUDA内核,性能比人类专家优化得还要好!翻倍碾压原生PyTorch,华人主创
2025-05-31 12:04:12
软银拟改造工厂为数据中心生产电池
2026-04-24 11:07:51
阶跃与腾讯云合作打造新一代 AI 座舱解决方案
2026-04-23 19:26:30
Gartner:阿里云稳居中国第一 份额扩大至32.8%
2026-04-24 12:09:17
特斯拉CEO马斯克:预计未来AI芯片将严重不足
2026-04-23 11:06:01
新模型上线期间出现功能异常 月之暗面公布补偿方案:全员额度重置
2026-04-22 22:32:08
存储“超级周期”进入业绩兑现阶段
2026-04-24 06:56:46
外交部:中方坚决反对美方污蔑抹黑中国人工智能产业发展成就
2026-04-24 16:21:03
Mobileye 2026财年一季度营收增长27%,自动驾驶商业化进程持续推进
2026-04-24 18:24:51
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
科大讯飞发布燎原N30m笔记本,重塑全栈国产AIPC新标杆
2026-04-22 21:27:36
国家人工智能产业投资基金等入股黑湖科技
2026-04-23 11:03:52
京东方申请注册AI工厂商标
2026-04-24 13:12:56
688 文章
538089 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38