综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,英伟达发布CUDA 13.1,推出革命性CUDA Tile编程模型,开发者可用15行Python代码实现媲美200行C++的GPU性能。新模型将数据组织为Tile,编译器自动优化硬件映射,大幅降低开发门槛,特别适合AI算法开发。新增功能包括cuBLAS FP64仿真、Grouped GEMM API加速MoE场景等,同时Nsight工具支持Tile内核分析。尽管Tile模型提升跨代GPU兼容性,但英伟达强调其基于CUDA生态,迁移至其他厂商硬件仍需重写代码。芯片界传奇Jim Keller质疑此举可能削弱CUDA护城河,因其抽象层次更高,或使AI内核更易移植至AMD、Intel等平台。此次更新显著降低了高性能GPU编程的技术壁垒,惠及更多开发者与研究者。
原文链接
11月19日,中诚华隆在北京发布首款全国产训推一体AI芯片HL系列。HL100采用自研GPGPU+NPU融合架构,FP16算力达256 TFLOPS,支持128GB LPDDR5显存,兼容CUDA生态,显存容量为国外某AI芯片的1.33倍。该芯片能效比3.41 TFLOPS/W,同等功耗下算力为国外芯片的8倍,总拥有成本仅为1/4,支持灵活扩展至千卡规模。此外,中诚华隆规划了未来三代产品(HL200、HL200Pro、HL400),原生支持FP8/FP4,对标国际主流性能,满足下一代生成式AI需求。中诚华隆成立于2017年,专注于自主可控的通算、智算等基础设施建设。
原文链接
11月10日,微软被曝开发新工具包,可将英伟达CUDA代码转译至AMD ROCm平台运行。该工具通过Runtime兼容层技术,动态翻译CUDA API调用为ROCm指令,降低开发者迁移门槛。此举旨在打破英伟达在AI领域的CUDA生态霸权,推动硬件多样化。随着AI推理需求增长,昂贵的英伟达GPU推高成本,微软希望借助AMD芯片(如MI300X系列)提供更经济的算力选择。这一战略可能改变市场格局,削弱英伟达垄断地位,促进AI硬件与软件生态的开放性。
原文链接
2025年9月,甲骨文公司宣布投入16亿美元进行大规模重组,裁员可能超3000人,重心转向AI基础设施。为履行与OpenAI等公司签署的云协议,甲骨文计划每年在数据中心投入数十亿美元,导致现金流自1992年以来首次转负。其股价年内上涨近90%,AI基础设施收入增长55%,预计五年内达1440亿美元。与此同时,全球科技行业面临产能危机,微软、亚马逊等巨头也加大投资优化AI专用设施,但英伟达GPU短缺等问题制约发展。中国国产AI芯片市场规模达380亿美元,但软件生态仍依赖CUDA,技术差距亟待解决。
原文链接
2025年8月,A股市场见证寒武纪股价飙升,22日涨停涨幅达20%,市值突破5200亿元,超越中芯国际成半导体行业龙头;25日再涨11.4%,市值逼近5800亿元,直追贵州茅台。此轮暴涨源于AI公司DeepSeek发布适配国产芯片的UE8M0 FP8技术,激发市场对国产算力未来的想象。然而,寒武纪市盈率高达4010倍,盈利能力尚不稳固,Q1净利润3.55亿元中有较大比例依赖非经常性损益,基本面存疑。同时,国内竞争激烈,国际CUDA生态壁垒高企,寒武纪突围之路挑战重重。资本市场对其寄予厚望,但千倍市盈与现实基本面的巨大落差,让其未来充满不确定性。
原文链接
2025年7月,苹果宣布其MLX框架新增对英伟达CUDA的支持,引发广泛关注。MLX是苹果专为端侧AI模型训练推出的开源框架,此前主要适配自研芯片。由于英伟达CUDA生态在AI开发领域的主导地位及其市值突破4万亿美元的强势表现,苹果选择妥协,主动拥抱CUDA以满足开发者需求。此举允许苹果开发者利用英伟达GPU训练模型,并提升跨平台部署效率。这一战略调整被视作苹果十年来的重要举措,也再次引发对其与英伟达“陈年旧怨”的讨论。CUDA作为英伟达的核心护城河,拥有超500万开发者和4万家企业支持,苹果此举意在借力CUDA生态扩大自身AI市场影响力,同时规避法律风险。
原文链接
7月16日,苹果专为Apple Silicon设计的机器学习框架MLX正新增对英伟达CUDA的支持。这一更新允许开发者在Apple Silicon Mac上开发应用后,导出至CUDA环境运行,从而降低硬件成本。此前,由于MLX深度集成于Metal框架,无法在macOS外运行,开发者需额外硬件完成部署测试。新支持由GitHub开发者@zcbenz主导,通过模块化逐步并入MLX主分支。该功能仅限从苹果环境导出代码至Nvidia硬件运行,不能直接在Mac上使用Nvidia显卡或运行基于CUDA的项目。此举有助于小规模开发者节省开支,并结合Nvidia硬件的高性能提升算力支持。
原文链接
2025年7月,英伟达市值突破4万亿美元,成为全球资本市场焦点。其成功背后不仅是GPU硬件,更是近20年前推出的CUDA生态系统的支撑。CUDA通过强大的开发者社区和工具链形成网络效应,令竞争对手难以超越。此外,英伟达通过‘向上集成’战略,从卖GPU芯片到提供全栈AI解决方案,不断提升客户价值与粘性。专家指出,英伟达正契合‘主权AI’趋势,为各国构建独立AI基础设施提供关键支持,进一步巩固其地缘政治战略资源地位。这使得其4万亿美元市值更具确定性与不可替代性。
原文链接
7月3日,英伟达市值达3.92万亿美元,超越苹果成为史上最高上市公司,但其AI GPU霸主地位正面临ASIC芯片阵营的严峻挑战。谷歌、亚马逊、Meta等云巨头加速自研AI芯片,OpenAI也被曝测试谷歌TPU,试图减少对英伟达的依赖。ASIC芯片因其高效率和低成本,在推理与训练场景中逐渐崭露头角,预计2026年出货量可能超越英伟达GPU。此外,英伟达营收过度依赖少数大客户,产品高昂成本令中小客户却步,封闭的CUDA生态也引发开发者不满。尽管英伟达推出NVLink Fusion应对UALink联盟的竞争,但市场去中心化趋势明显,英伟达的领先地位并不稳固。
原文链接
黄仁勋发布量子计算专用CUDA!预言量子计算机几年内应用,但现在还离不开GB200
“量子计算正在到达一个拐点。”在GTC巴黎的演讲中,英伟达CEO黄仁勋对量子计算作出新判断。他改变了此前“实用量子计算机还需20年”的观点,预言实际应用将在几年内实现。然而,他强调,当前量子计算机开发仍需依赖英伟...
原文链接
加载更多
暂无内容