综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,英伟达发布CUDA 13.1,推出革命性CUDA Tile编程模型,开发者可用15行Python代码实现媲美200行C++的GPU性能。新模型将数据组织为Tile,编译器自动优化硬件映射,大幅降低开发门槛,特别适合AI算法开发。新增功能包括cuBLAS FP64仿真、Grouped GEMM API加速MoE场景等,同时Nsight工具支持Tile内核分析。尽管Tile模型提升跨代GPU兼容性,但英伟达强调其基于CUDA生态,迁移至其他厂商硬件仍需重写代码。芯片界传奇Jim Keller质疑此举可能削弱CUDA护城河,因其抽象层次更高,或使AI内核更易移植至AMD、Intel等平台。此次更新显著降低了高性能GPU编程的技术壁垒,惠及更多开发者与研究者。
原文链接
加载更多
暂无内容