综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月8日,在SEMICON CHINA 2026全球半导体产业战略峰会上,中国半导体行业协会副理事长魏少军提出突破NVIDIA CUDA生态垄断的新思路。他建议放弃复刻CUDA的传统路径,转向“软件定义芯片(SDC)”架构,通过上层软件动态定义芯片功能,实现软硬件深度协同。这一颠覆性思维旨在满足人工智能终端设备的定制化需求,提升算力供给,同时降低对西方技术的依赖。魏少军强调,尽管初期可能不够完善,但必须通过应用场景试错推动技术成熟与生态培育。此方案为中国构建自主算力体系提供了可行路径,具有重要战略意义。
原文链接
标题:天下苦CUDA久矣,又一国产方案上桌了
正文:
允中 发自 凹非寺
量子位 | 公众号 QbitAI
国产算力基建发展多年,核心问题始终是:芯片够多吗?但对开发者来说,更扎心的问题是:好用吗?
如果把AI开发比作做饭,现在的尴尬在于——虽然国产硬件越来越多,但大厨们仍习惯用进口生态...
原文链接
11月10日,微软被曝开发新工具包,可将英伟达CUDA代码转译至AMD ROCm平台运行。该工具通过Runtime兼容层技术,动态翻译CUDA API调用为ROCm指令,降低开发者迁移门槛。此举旨在打破英伟达在AI领域的CUDA生态霸权,推动硬件多样化。随着AI推理需求增长,昂贵的英伟达GPU推高成本,微软希望借助AMD芯片(如MI300X系列)提供更经济的算力选择。这一战略可能改变市场格局,削弱英伟达垄断地位,促进AI硬件与软件生态的开放性。
原文链接
2025年8月,A股市场见证寒武纪股价飙升,22日涨停涨幅达20%,市值突破5200亿元,超越中芯国际成半导体行业龙头;25日再涨11.4%,市值逼近5800亿元,直追贵州茅台。此轮暴涨源于AI公司DeepSeek发布适配国产芯片的UE8M0 FP8技术,激发市场对国产算力未来的想象。然而,寒武纪市盈率高达4010倍,盈利能力尚不稳固,Q1净利润3.55亿元中有较大比例依赖非经常性损益,基本面存疑。同时,国内竞争激烈,国际CUDA生态壁垒高企,寒武纪突围之路挑战重重。资本市场对其寄予厚望,但千倍市盈与现实基本面的巨大落差,让其未来充满不确定性。
原文链接
2025年7月,苹果宣布其MLX框架新增对英伟达CUDA的支持,引发广泛关注。MLX是苹果专为端侧AI模型训练推出的开源框架,此前主要适配自研芯片。由于英伟达CUDA生态在AI开发领域的主导地位及其市值突破4万亿美元的强势表现,苹果选择妥协,主动拥抱CUDA以满足开发者需求。此举允许苹果开发者利用英伟达GPU训练模型,并提升跨平台部署效率。这一战略调整被视作苹果十年来的重要举措,也再次引发对其与英伟达“陈年旧怨”的讨论。CUDA作为英伟达的核心护城河,拥有超500万开发者和4万家企业支持,苹果此举意在借力CUDA生态扩大自身AI市场影响力,同时规避法律风险。
原文链接
2025年7月,英伟达市值突破4万亿美元,成为全球资本市场焦点。其成功背后不仅是GPU硬件,更是近20年前推出的CUDA生态系统的支撑。CUDA通过强大的开发者社区和工具链形成网络效应,令竞争对手难以超越。此外,英伟达通过‘向上集成’战略,从卖GPU芯片到提供全栈AI解决方案,不断提升客户价值与粘性。专家指出,英伟达正契合‘主权AI’趋势,为各国构建独立AI基础设施提供关键支持,进一步巩固其地缘政治战略资源地位。这使得其4万亿美元市值更具确定性与不可替代性。
原文链接
标题:DeepSeek技术解析:如何冲击英伟达两大壁垒?
DeepSeek的V3模型以557.6万的训练成本,实现了与OpenAI O1相近的性能,引发全球关注。这不仅使英伟达股价大跌,还引发了对芯片需求和市场前景的讨论。
DeepSeek的创新主要集中在基础模型能力和训练方法上。陈羽北指出,V3模...
原文链接
英伟达股价刚从4万亿元暴跌中恢复,又面临新挑战。硬件媒体Tom's Hardware报道,DeepSeek-V3论文揭示其绕过CUDA,采用更底层的PTX语言优化。DeepSeek-V3通过修改132个流式多处理器中的20个,专注于服务器间通信而非计算,从而突破硬件通信速度限制。PTX在接近汇编语言层级运行,允许细粒度优化,但复杂且难以维护。亚马逊工程师质疑CUDA是否仍是护城河,若DeepSeek开源CUDA替代方案,情况将如何变化?
DeepSeek虽使用PTX,但仍依赖CUDA生态,不过展示了优化其他GPU的能力。DeepSeek已与AMD、华为等合作,支持多种硬件。此外,DeepSeek-R1编写代码显著提升了大模型推理框架的速度,表明AI有能力编写高效底层代码,甚至优化自身。
原文链接
突破Nvidia CUDA的垄断,新工具SCALE登场。英国公司Spectral Compute推出SCALE,一个专为AMD GPU设计的GPGPU工具链,允许CUDA程序无需修改在AMD设备上本地运行。SCALE利用开源LLVM组件,兼容nvcc编译器,支持CUDA源代码和NVPTX汇编,无需移植至其他语言。它已在Blender等软件上通过测试,正逐步支持更多GPU型号。AMD则通过HIP和ZLUDA项目,以及英特尔的SYCL和OneAPI,推动跨平台AI开发。这些举措表明GPU生态多元化,挑战CUDA在AI和HPC领域的主导地位。随着PyTorch等库的流行,AI开发者对CUDA的依赖减弱,预示着未来GPU技术的更多可能性。
原文链接
英国初创公司Spectral Compute发布了一款名为SCALE的工具,可在AMD显卡上模拟CUDA程序,无需修改直接编译运行,引发热议并登上HackerNews热榜。这款工具通过兼容的nvcc编译器和ROCm库,支持CUDA原生代码,声称实现CUDA完全兼容,开发者无需为不同GPU平台编写代码。尽管存在一些功能限制和性能争议,如对TensorCore和特定加速框架的支持不足,以及潜在的法律问题,SCALE仍引发技术与法律讨论持续进行,开发者将通过实际使用来验证其有效性。
原文链接
加载更多
暂无内容