1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
“DeepSeek甚至绕过了CUDA”,论文细节再引热议,工程师灵魂提问:英伟达护城河还在吗?
英伟达股价刚从4万亿元暴跌中恢复,又面临新挑战。硬件媒体Tom's Hardware报道,DeepSeek-V3论文揭示其绕过CUDA,采用更底层的PTX语言优化。DeepSeek-V3通过修改132个流式多处理器中的20个,专注于服务器间通信而非计算,从而突破硬件通信速度限制。PTX在接近汇编语言层级运行,允许细粒度优化,但复杂且难以维护。亚马逊工程师质疑CUDA是否仍是护城河,若DeepSeek开源CUDA替代方案,情况将如何变化? DeepSeek虽使用PTX,但仍依赖CUDA生态,不过展示了优化其他GPU的能力。DeepSeek已与AMD、华为等合作,支持多种硬件。此外,DeepSeek-R1编写代码显著提升了大模型推理框架的速度,表明AI有能力编写高效底层代码,甚至优化自身。
像素宇宙
01-29 12:06:53
CUDA
DeepSeek
PTX
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序