综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月20日,英特尔在2025 OCP全球峰会上展示了一款高效异构AI系统。该系统结合英特尔自家Gaudi3 AI加速器与英伟达B200 GPU,分工明确:B200负责AI模型预填充,Gaudi3负责解码。相比仅使用B200的同构方案,新系统在Llama开源模型上实现了高达70%的同TCO性能提升。此外,这一混合机架系统采用英伟达ConnectX-7 400GbE网卡、BlueField-3 DPU及博通Tomahawk 5交换芯片,扩展能力更强。此创新为AI计算领域带来更高效率和灵活性,值得关注。
原文链接
2025年10月,OpenAI与博通宣布合作,将共同部署10GW规模的AI加速器,预计2026年下半年开始部署,2029年底前完成。OpenAI负责设计芯片与系统,博通负责开发与部署,双方已合作约18个月。OpenAI自研芯片旨在优化特定工作负载,缓解算力瓶颈,并利用AI加速芯片设计。此外,OpenAI还与英伟达、AMD达成类似合作,分别部署10GW和6GW的AI集群。OpenAI总裁Greg Brockman透露,自研芯片是垂直整合的关键,有助于提升效率并降低成本。目前,OpenAI正研发一款推理芯片,最快或在9个月内实现量产。
原文链接
10月13日,OpenAI与博通宣布达成战略合作,计划于2026年推出定制数据中心芯片并部署10吉瓦的AI加速器。博通盘前股价因此大涨12%。双方将共同开发包括博通加速器和以太网解决方案在内的系统,用于纵向与横向扩展。博通将负责部署人工智能加速器和网络系统机架,预计2026年下半年启动,并于2029年底完成。OpenAI将设计加速器和系统,通过与博通合作开发和部署,将其前沿模型的知识嵌入硬件,提升能力和智能水平。这些系统将采用博通的以太网解决方案进行扩展,满足全球对人工智能的需求,并部署于OpenAI及其合作伙伴的数据中心。
原文链接
IBM于10月7日宣布,其AI推理加速器Spyre将在本季度正式投入商业使用。z17和LinuxONE 5将于10月28日支持Spyre,而Power11则预计在12月初支持该组件。Spyre采用PCIe AIC卡设计,功耗75W,每卡含32个加速器核心,基于5nm工艺制程,晶体管数量达256亿。z17和LinuxONE 5单机最多可部署48张Spyre卡,Power11支持16张。IBM表示,Spyre允许企业客户在本地运行多模态AI推理任务,在提升业务效率的同时确保数据与应用的安全性。
原文链接
2025年9月25日,高通在第十届骁龙技术峰会的北京分会场启动了“AI加速计划”。该计划联合13家合作伙伴,包括GTI、中国电信、小米、荣耀等,旨在推动边缘智能能力与应用场景的创新,加速AI在各行业的规模化落地。此次峰会首次在中国设立分会场,凸显高通对中国市场的重视。这也是高通成立40周年及进入中国30周年的关键节点,延续此前“5G领航计划”和“5G物联网创新计划”的成功经验,进一步布局AI新时代的技术生态。
原文链接
9月25日,在2025京东全球科技探索者大会上,京东云总裁曹鹏宣布,京东云JoyScale AI算力平台实现行业最丰富的高性能异构计算支持。该平台兼容适配昇腾、寒武纪、海光等多种国产加速卡,并支持10+家国产异构算力调度及20+训练推理框架调优。同时,JoyScale也是业界唯一支持英伟达显卡与国产异构加速卡远程调用的算力平台,展现技术领先性。(记者 黄心怡)
原文链接
2025年9月24日,北京——高通在2025骁龙峰会・中国上携手GTI、中国电信、中国移动、中国联通及小米、荣耀、vivo、OPPO、中兴等企业,共同启动“AI加速计划”。高通CEO安蒙指出,六大趋势驱动AI未来发展,包括以智能体为中心的转型、计算架构变革等,目标是实现AI无处不在。高通CFO Akash Palkhiwala强调,将与中国伙伴合作,在智能手机上优化AI功能,并推动智能体AI体验和多场景应用落地。宇树科技创始人王兴兴亦出席,探讨人形机器人发展对芯片算力与通信创新的需求,呼吁产业开放合作,加速具身智能未来。
原文链接
9月24日,2025骁龙峰会·中国在北京开幕,高通携手生态伙伴发布“AI加速计划”,推动边缘智能能力与应用场景的规模化落地。峰会以“灵光闪烁 有龙则灵”为主题,展示了智能手机、汽车、XR等领域的百余项技术创新。高通中国区董事长孟樸回顾了公司植根中国30年的合作历程,并展望AI与连接重塑终端的新时代。高通CEO安蒙指出六大趋势驱动AI未来发展,“AI加速计划”将围绕智能手机、智能体AI及模型应用探索展开。来自GTI、中国电信、中国移动、中国联通等合作伙伴代表出席活动并分享未来合作愿景。
原文链接
9月19日,英特尔发布最新AI加速器Gaudi 3,包含OAM模块、多OAM卡基板和PCIe AIC三种形式。尽管市场反响平淡,但戴尔于美国时间17日宣布,其PowerEdge XE7740服务器率先支持Gaudi 3 PCIe AIC(HL-338)配置,成为首家提供该集成方案的厂商。HL-338 TDP为600W,配备128GB HBM2E内存和3.7TB/s带宽,功耗低于900W的HL-325L。XE7740服务器可安装8张HL-338卡,并支持四路桥接扩展,能在10kW风冷限制下提供强大AI微调与推理算力资源。
原文链接
9月16日,在2025腾讯全球数字生态大会上,腾讯云总裁邱跃鹏宣布腾讯云将全面升级云基础设施,以支持Agent规模化落地和企业全球化发展。目前,腾讯云在推理加速、Agent Infra及国际化布局等领域取得突破。推理加速方面,腾讯云通过开源贡献优化技术,向多个社区提交创新方案,并自研开源FlexKV多级缓存技术,大幅降低大模型推理的内存占用,首字时延减少达70%。此次升级将进一步强化腾讯云的技术优势与全球化服务能力。
原文链接
加载更多
暂无内容