英伟达股价刚从4万亿元暴跌中恢复,又面临新挑战。硬件媒体Tom's Hardware报道,DeepSeek-V3论文揭示其绕过CUDA,采用更底层的PTX语言优化。DeepSeek-V3通过修改132个流式多处理器中的20个,专注于服务器间通信而非计算,从而突破硬件通信速度限制。PTX在接近汇编语言层级运行,允许细粒度优化,但复杂且难以维护。亚马逊工程师质疑CUDA是否仍是护城河,若DeepSeek开源CUDA替代方案,情况将如何变化?
DeepSeek虽使用PTX,但仍依赖CUDA生态,不过展示了优化其他GPU的能力。DeepSeek已与AMD、华为等合作,支持多种硬件。此外,DeepSeek-R1编写代码显著提升了大模型推理框架的速度,表明AI有能力编写高效底层代码,甚至优化自身。
原文链接
本文链接:https://kx.umi6.com/article/12334.html
转载请注明文章出处
相关推荐
.png)
换一换
做播客,AI永远取代不了人
2024-12-25 11:03:04
融资千万的AI写作初创散了,同一赛道,日本跑出500万月活产品
2024-10-31 10:41:13
Sora二代实机演示曝光!解锁图生视频,奥特曼暗示:期待周一
2024-12-09 13:23:54
444 文章
62090 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21