1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
马斯克详谈AI5芯片:由三星和台积电一起生产,不会弃用英伟达GPU!
10月23日,特斯拉CEO马斯克透露,即将推出的AI5芯片将由三星(德克萨斯州工厂)和台积电(亚利桑那州工厂)共同生产。该芯片性能为AI4的40倍,算力提升8倍,内存增加9倍,专为自动驾驶及机器人产品设计。马斯克称其为“史诗级”产品,并计划实现过剩生产,未使用的芯片将用于数据中心。特斯拉将继续使用英伟达GPU训练模型,但AI5的计算能力相当于81000个英伟达H100芯片。马斯克表示,由于AI5仅服务于特斯拉,设计更简化,性价比可能提高10倍。他还提到,AI6芯片将是未来AI生态的核心,由三星代工。
数字墨迹
10-23 10:06:47
AI5芯片
特斯拉
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
Flash Attention作者Tri Dao在最新播客《Unsupervised Learning》中预测,英伟达GPU在未来2-3年内将失去主导地位,AI硬件市场将走向多元化。他认为,随着专用芯片的兴起,推理成本有望再降10倍,而Transformer架构已足够稳定,可支撑未来AI发展。他指出,Mixture of Experts(MoE)等技术推动了模型稀疏化与推理优化,同时低延迟、高吞吐等多样化工作负载需求将催生不同硬件优化方向。此外,他对AI达到专家水平表示期待,认为现有架构虽能实现AGI,但更高效的设计或可大幅降低成本。他还提到,实时视频生成和机器人领域可能成为下一波重要应用。
Nebula
09-29 15:09:28
AI硬件
推理成本
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
Omdia 预测:2025~2026 年将成 AI 数据中心芯片快速增长节奏末尾
分析机构Omdia于8月28日预测,AI数据中心芯片市场将在2025年达到2070亿美元,较2024年的1230亿美元大幅增长,这一年的增幅接近未来五年总和。到2026年,AI基础设施支出将占数据中心总支出的峰值,随后增速逐步放缓,至2030年市场规模预计为2860亿美元。非英伟达GPU解决方案(如ASIC、ASSP及AMD加速器)正获得更多市场青睐。分析师Alexander Harrowell指出,AI应用普及、模型微调需求以及推理模型推动增长,但更小、更高效的模型正减缓计算需求,技术优化也在提升效率。
AI创意引擎
09-01 17:20:23
AI数据中心芯片
Omdia预测
非英伟达GPU解决方案
分享至
打开微信扫一扫
内容投诉
生成图片
中国AI芯片维修需求暴增 有商家月修500块英伟达高端GPU
2025年7月25日,中国市场上AI芯片维修需求激增,十余家小型公司专门维修英伟达H100、A100等高端GPU。这些被美国禁售的芯片通过特殊渠道流入国内。深圳一商家自2024年底转型维修AI芯片,现月均维修量达500块,并配备256台服务器测试机房保障质量。因禁令限制,英伟达无法提供官方维修服务,而未经授权的维修被其称为“不可行”。尽管英伟达推出中国特供版H20芯片,但售价超百万元且性能难以满足大模型训练需求。业内人士称,H100/A100因高负荷运转故障率攀升,寿命仅2-5年。维修报价1-2万元/块,市场需求已扩展至最新B200芯片,搭载8块B200的服务器售价突破300万元。
E-Poet
07-25 12:22:34
AI芯片维修
中国市场
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
英伟达GPU被曝严重漏洞,致模型准确率暴跌99.9%
2025年7月,英伟达GPU被曝出严重漏洞,一种名为GPUHammer的Rowhammer攻击可致模型准确率从80%暴跌至0.02%,影响相当于‘灾难性脑损伤’。多伦多大学研究人员在RTX A6000上测试成功,其他型号也可能受影响。该攻击通过物理方式篡改显存数据,可能危及自动驾驶、医疗AI等关键领域。英伟达建议启用系统级纠错码(ECC)防御,但会导致性能下降3%-10%。研究指出,部分GPU架构(如RTX 3080、A100)因设计不同暂不受影响,未来片上ECC和内存隔离技术有望增强防护。AI模型安全建设面临新挑战。
心智奇点
07-23 15:52:55
Rowhammer攻击
模型准确率
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
等效 5000 万块英伟达 H100 GPU,马斯克公布 xAI 五年算力目标
2025年7月23日,埃隆·马斯克在X平台公布xAI未来五年算力目标,计划实现等效5000万块英伟达H100 GPU的算力,同时强调能效更优。xAI正建设Colossus 2超级集群,首批英伟达GB200/GB300系统预计数周内上线。此外,为支持大规模AI算力建设,xAI正洽谈一笔高达120亿美元的新投资,用于扩大GPU租赁规模。与此同时,竞争对手OpenAI的CEO萨姆·奥尔特曼提出到2025年底实现1亿块GPU的技术愿景,远超其当前目标百倍。
梦境编程师
07-23 09:46:53
xAI
算力目标
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
郭明錤:传言中苹果购买英伟达GPU短期内不会带来AI优势
据1日《科创板日报》报道,有传闻称苹果拟出资10亿美元购入英伟达GB300 NVL72芯片,但知名分析师郭明錤认为此举短期内无法显著增强苹果在AI领域的竞争力。郭指出,此订单规模较小,仅为Meta Platforms同期采购量(约130万个GPU)的1/70,且Meta正集中资源开发大语言模型AI服务器,以优化运营效率。相比之下,苹果在此方面可能缺乏相应布局。
跨界思维
04-01 14:28:52
英伟达GPU
苹果
郭明錤
分享至
打开微信扫一扫
内容投诉
生成图片
马斯克在直播中首次披露Grok 3的训练成本:20万块英伟达GPU
财联社2月18日电,马斯克在直播中首次透露,Grok 3的训练成本高达20万块英伟达GPU。训练工作在xAI公司的数据中心内完成。
数据炼金师
02-18 15:36:11
Grok 3
英伟达GPU
训练成本
分享至
打开微信扫一扫
内容投诉
生成图片
Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍
【Cerebras Systems发布全球最快AI推理解决方案】8月28日,Cerebras Systems宣布推出全新AI推理解决方案——Cerebras Inference,此方案在性能上超越了当前市场上的主流AI推理解决方案,速度达到了英伟达同类方案的20倍。针对Llama 3.1 8B和70...
数码游侠
08-28 11:14:44
AI推理解决方案
Cerebras Inference
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
SK电信将在首尔开设AI数据中心 全部配套英伟达GPU
【SK电信与Lambda合作在首尔设立AI数据中心】韩国最大电信运营商SK电信宣布,将于12月在首尔江南区与GPU云服务公司Lambda合作开设AI数据中心,全部配备英伟达GPU。双方已签署AI云服务合作协议,旨在扩大GPU即服务(GPUaaS)业务,并巩固Lambda在韩国的地位。Lambda成立...
幻彩逻辑RainbowLogic
08-21 18:15:30
AI数据中心
SK电信
英伟达GPU
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序