英伟达GPU - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

马斯克详谈AI5芯片：由三星和台积电一起生产，不会弃用英伟达GPU！

10月23日，特斯拉CEO马斯克透露，即将推出的AI5芯片将由三星（德克萨斯州工厂）和台积电（亚利桑那州工厂）共同生产。该芯片性能为AI4的40倍，算力提升8倍，内存增加9倍，专为自动驾驶及机器人产品设计。马斯克称其为“史诗级”产品，并计划实现过剩生产，未使用的芯片将用于数据中心。特斯拉将继续使用英伟达GPU训练模型，但AI5的计算能力相当于81000个英伟达H100芯片。马斯克表示，由于AI5仅服务于特斯拉，设计更简化，性价比可能提高10倍。他还提到，AI6芯片将是未来AI生态的核心，由三星代工。

原文链接

数字墨迹

10-23 10:06:47

AI5芯片

特斯拉

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

Flash Attention作者最新播客：英伟达GPU统治三年内将终结

Flash Attention作者Tri Dao在最新播客《Unsupervised Learning》中预测，英伟达GPU在未来2-3年内将失去主导地位，AI硬件市场将走向多元化。他认为，随着专用芯片的兴起，推理成本有望再降10倍，而Transformer架构已足够稳定，可支撑未来AI发展。他指出，Mixture of Experts（MoE）等技术推动了模型稀疏化与推理优化，同时低延迟、高吞吐等多样化工作负载需求将催生不同硬件优化方向。此外，他对AI达到专家水平表示期待，认为现有架构虽能实现AGI，但更高效的设计或可大幅降低成本。他还提到，实时视频生成和机器人领域可能成为下一波重要应用。

原文链接

Nebula

09-29 15:09:28

AI硬件

推理成本

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

Omdia 预测：2025~2026 年将成 AI 数据中心芯片快速增长节奏末尾

分析机构Omdia于8月28日预测，AI数据中心芯片市场将在2025年达到2070亿美元，较2024年的1230亿美元大幅增长，这一年的增幅接近未来五年总和。到2026年，AI基础设施支出将占数据中心总支出的峰值，随后增速逐步放缓，至2030年市场规模预计为2860亿美元。非英伟达GPU解决方案（如ASIC、ASSP及AMD加速器）正获得更多市场青睐。分析师Alexander Harrowell指出，AI应用普及、模型微调需求以及推理模型推动增长，但更小、更高效的模型正减缓计算需求，技术优化也在提升效率。

原文链接

AI创意引擎

09-01 17:20:23

AI数据中心芯片

Omdia预测

非英伟达GPU解决方案

分享至

打开微信扫一扫

内容投诉

生成图片

中国AI芯片维修需求暴增有商家月修500块英伟达高端GPU

2025年7月25日，中国市场上AI芯片维修需求激增，十余家小型公司专门维修英伟达H100、A100等高端GPU。这些被美国禁售的芯片通过特殊渠道流入国内。深圳一商家自2024年底转型维修AI芯片，现月均维修量达500块，并配备256台服务器测试机房保障质量。因禁令限制，英伟达无法提供官方维修服务，而未经授权的维修被其称为“不可行”。尽管英伟达推出中国特供版H20芯片，但售价超百万元且性能难以满足大模型训练需求。业内人士称，H100/A100因高负荷运转故障率攀升，寿命仅2-5年。维修报价1-2万元/块，市场需求已扩展至最新B200芯片，搭载8块B200的服务器售价突破300万元。

原文链接

E-Poet

07-25 12:22:34

AI芯片维修

中国市场

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

英伟达GPU被曝严重漏洞，致模型准确率暴跌99.9%

2025年7月，英伟达GPU被曝出严重漏洞，一种名为GPUHammer的Rowhammer攻击可致模型准确率从80%暴跌至0.02%，影响相当于‘灾难性脑损伤’。多伦多大学研究人员在RTX A6000上测试成功，其他型号也可能受影响。该攻击通过物理方式篡改显存数据，可能危及自动驾驶、医疗AI等关键领域。英伟达建议启用系统级纠错码（ECC）防御，但会导致性能下降3%-10%。研究指出，部分GPU架构（如RTX 3080、A100）因设计不同暂不受影响，未来片上ECC和内存隔离技术有望增强防护。AI模型安全建设面临新挑战。

原文链接

心智奇点

07-23 15:52:55

Rowhammer攻击

模型准确率

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

等效 5000 万块英伟达 H100 GPU，马斯克公布 xAI 五年算力目标

2025年7月23日，埃隆·马斯克在X平台公布xAI未来五年算力目标，计划实现等效5000万块英伟达H100 GPU的算力，同时强调能效更优。xAI正建设Colossus 2超级集群，首批英伟达GB200/GB300系统预计数周内上线。此外，为支持大规模AI算力建设，xAI正洽谈一笔高达120亿美元的新投资，用于扩大GPU租赁规模。与此同时，竞争对手OpenAI的CEO萨姆·奥尔特曼提出到2025年底实现1亿块GPU的技术愿景，远超其当前目标百倍。

原文链接

梦境编程师

07-23 09:46:53

xAI

算力目标

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

郭明錤：传言中苹果购买英伟达GPU短期内不会带来AI优势

据1日《科创板日报》报道，有传闻称苹果拟出资10亿美元购入英伟达GB300 NVL72芯片，但知名分析师郭明錤认为此举短期内无法显著增强苹果在AI领域的竞争力。郭指出，此订单规模较小，仅为Meta Platforms同期采购量（约130万个GPU）的1/70，且Meta正集中资源开发大语言模型AI服务器，以优化运营效率。相比之下，苹果在此方面可能缺乏相应布局。

原文链接

跨界思维

04-01 14:28:52

英伟达GPU

苹果

郭明錤

分享至

打开微信扫一扫

内容投诉

生成图片

马斯克在直播中首次披露Grok 3的训练成本：20万块英伟达GPU

财联社2月18日电，马斯克在直播中首次透露，Grok 3的训练成本高达20万块英伟达GPU。训练工作在xAI公司的数据中心内完成。

原文链接

数据炼金师

02-18 15:36:11

Grok 3

英伟达GPU

训练成本

分享至

打开微信扫一扫

内容投诉

生成图片

Cerebras 推出全球最快 AI 推理解决方案，速度是英伟达方案的 20 倍

【Cerebras Systems发布全球最快AI推理解决方案】8月28日，Cerebras Systems宣布推出全新AI推理解决方案——Cerebras Inference，此方案在性能上超越了当前市场上的主流AI推理解决方案，速度达到了英伟达同类方案的20倍。针对Llama 3.1 8B和70...

原文链接

数码游侠

08-28 11:14:44

AI推理解决方案

Cerebras Inference

英伟达GPU

分享至

打开微信扫一扫

内容投诉

生成图片

SK电信将在首尔开设AI数据中心全部配套英伟达GPU

【SK电信与Lambda合作在首尔设立AI数据中心】韩国最大电信运营商SK电信宣布，将于12月在首尔江南区与GPU云服务公司Lambda合作开设AI数据中心，全部配备英伟达GPU。双方已签署AI云服务合作协议，旨在扩大GPU即服务（GPUaaS）业务，并巩固Lambda在韩国的地位。Lambda成立...

原文链接