综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
高通技术公司在2026年世界移动通信大会(MWC 2026)上展示了其最新的AI推理基础设施解决方案,包括Qualcomm AI200机架系统、加速卡和AI基础设施管理套件。该系统将AI加速、内存架构、互连技术和管理软件集成到一个可扩展的平台中,支持高达43 TB内存容量,适用于运行旗舰级AI模型推理。单个AI200加速卡可支持3500亿参数生成式AI模型,并具备扩展至1万亿参数的能力。此外,通过去年12月收购Alphawave Semi,高通增强了高速连接和数据传输能力,进一步优化了AI工作负载的处理效率。AI基础设施管理套件由HUMAIN部署,提供配置、监控和故障处理功能,助力数据中心实现灵活扩展。这一系列创新旨在满足服务提供商在规模、效率和运营复杂性之间的平衡需求,推动AI技术在数据中心的深度应用。
原文链接
3月3日,受AI需求推动,PCB产业链涨价行情持续。日本半导体材料巨头Resonac自3月1日起将CCL及粘合胶片价格上调30%,业界预计涨价将传导至MLCC、HDI板、IC载板等高端制造环节。同时,英伟达LPU推理芯片或成PCB行业超级催化剂。市场人士指出,随着AI应用规模快速增长,专用AI推理芯片需求激增,将推动PCB行业实现量价齐升、工艺升级与材料革新,并提升行业集中度。这不仅提升PCB在AI芯片中的价值和重要性,还为行业打开全新市场空间。(上证报)
原文链接
当地时间2月10日,xAI联合创始人Tony Wu宣布离职,这是继去年8月Igor Babuschkin离开后,xAI失去的第二位联合创始人。Tony Wu负责AI推理能力,这一技术被视为下一代AI系统的核心竞争力。他的离职对xAI打击巨大,可能导致研发停滞6个月以上。目前xAI创始团队12人中已有5人离职,接近一半的离职率引发关注。分析认为,马斯克的极限压榨式管理风格和CEO主导的技术路线可能是人才流失的主要原因。与此同时,AI行业正处于‘人才血战’阶段,顶级研究员更倾向于选择能专注技术、减少干扰的平台。在AI竞赛中,落后半年可能意味着出局,xAI能否调整策略留住关键人才仍是未知数。
原文链接
2026年2月10日,英特尔锐炫Pro B60显卡与长城世恒X-AIGC工作站评测发布。这款专业级显卡基于第二代Xe²架构,配备24GB GDDR6显存、192bit位宽及456GB/s带宽,FP32性能达12.28 TFLOPS,INT8 AI性能为197 TOPS。通过4卡组合可实现96GB显存池,满足千人同时在线AI推理需求,性价比显著优于NVIDIA同类产品。搭配Intel Xeon处理器和256GB ECC内存的工作站方案,展现出在大规模MoE模型推理中的优势。此外,Intel的oneAPI工具降低了开发者迁移成本,助力Arc系列运行主流大模型。
原文链接
1月29日,恒润股份旗下润六尺-天顿大湾区AI推理算力产业基地正式启动运营。基地目前已部署超1400台服务器,提供逾3000P推理算力,未来将新增约3000台高性能服务器,总规模达万P以上,成为华南地区最大AI算力集群之一。该基地由深圳润六尺科技与深圳天顿数据合作建设,首批签约生态伙伴包括龙岗移动、联通、电信、龙岗城投集团等多家企业及机构。项目助力深圳及龙岗区打造国家人工智能产业高地,推动区域AI技术发展。
原文链接
2026年1月21日,金山云在年度Tech Talk上宣布星流平台全面升级,从资源管理平台转型为一站式AI训推全流程平台。升级后的平台覆盖异构资源调度、训练任务自愈、机器人行业应用支撑及模型API服务商业化落地的全链路闭环。麦肯锡预测,2028年全球AI推理市场规模将达1500亿美元,智算基础设施需求激增。金山云通过提升平台效率、突破行业边界、加速推理布局,为AI应用爆发做好准备。其机器人平台支持具身智能全链路开发,模型API服务已积累众多行业客户,并支持近40种模型,包括DeepSeek、Xiaomi MiMo等。金山云将持续携手生态伙伴,推动AI技术在真实场景中的价值落地。
原文链接
1月22日,AI推理GPU芯片公司曦望(Sunrise)宣布一年内完成近30亿元融资。投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团等产业资本,以及IDG资本、高榕创投、无极资本等知名VC/PE机构,还获得诚通混改基金等国资背景支持。融资将用于下一代推理GPU研发、规模化量产及生态建设,助力公司在AI芯片领域的技术突破与市场拓展。
原文链接
1月21日,NVIDIA CEO黄仁勋在采访中表示,未来电脑将能处理比现在强大10亿倍的AI推理问题。这一预测延续了他在去年GTC大会上的观点,强调算力需求的激增推动技术革新。为实现目标,NVIDIA正通过Rubin CPX项目和200亿美元收购Groq等举措提升AI能力。同时,随着AI行业崛起,NVIDIA已取代苹果成为台积电最大客户,台积电甚至对苹果采取强硬态度,要求涨价并取消优先出货权。此外,台积电2nm工艺首发权归AMD,而下一代A16工艺预计由NVIDIA费曼架构GPU率先采用,这是20多年来NVIDIA再次首发台积电最新工艺。与此同时,苹果正转向Intel的18A及14A工艺以分散订单依赖。
原文链接
2025年12月24日,英伟达与AI芯片初创公司Groq达成非独家推理技术许可协议,交易规模约200亿美元。Groq核心团队将加盟英伟达,但公司保持独立运营,继续发展其云服务业务。Groq的SRAM架构技术可绕过高带宽内存(HBM)和台积电CoWoS封装限制,显著提升推理芯片效率,降低延迟与成本。英伟达计划整合该技术,打造专攻AI快速推理的芯片,强化其在AI领域的领先地位。此外,谷歌、SambaNova等企业也在推理芯片领域展开激烈竞争,推出针对不同场景优化的创新产品。随着AI应用规模化落地,推理芯片成为行业新风口,推动AI技术普及与生态繁荣。
原文链接
12月23日,华为数据存储与中科弘云联合发布AI推理加速解决方案。该方案以华为OceanStor A系列存储为数据底座,结合中科弘云HyperCN平台,优化长序列推理体验。方案支持英伟达、昇腾、寒武纪等多元算力,兼容主流框架,并通过Kubernetes实现无缝对接。其核心优势包括异构管理、细粒度算力调度、推理加速及端到端AI工具链。实测显示,在智能问答场景中,首Token时延降低57.5%;在长文档推理中,序列长度为39K时,并发能力提升86%,吞吐提升36%。目前,该方案已在能源电力、智能制造等领域启动试点应用。
原文链接
加载更多
暂无内容