1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AI芯片:科技巨头的新战场

IBM 正式发布其面向AI时代的下一代企业计算产品,包括全新Telum II处理器和Spyre AI加速器,预计将于2025年上市。Telum II处理器采用更先进的三星5nm HPP制程技术,核心面积扩大至600mm²,晶体管数量增加至430亿个,运行频率提升至5.5GHz,同时内置DPU,显著提升I/O处理能力。而Spyre AI加速器,则采用基于三星5nm LPE制程技术,核心面积330mm²,260亿个晶体管,拥有32个计算核心,整体算力超过300TOPS,适合低延迟和高吞吐量AI应用。

微软 通过其分享的Maia 100规范,展示了其第一代自定义AI加速器,专为Azure中部署的大规模AI工作负载而设计。Maia 100系统垂直集成,采用台积电的N5工艺和COWOS-S中介层技术,尺寸约为820mm²,配备大型片上SRAM和四个HBM2E裸片,提供1.8 TB/s的总带宽和64 GB的容量,支持AI级数据处理。

FuriosaAI 推出全新AI加速器RNGD,专为数据中心的高性能、高效大型语言模型(LLM)和多模态模型推理而设计。RNGD具有150W的TDP、新颖的芯片架构和HBM3等高级内存技术,优化了LLM和多模态模型的推理性能。

英伟达 面对Blackwell产品的良率问题,计划在2024年第四季度提高产量。Blackwell GPU采用台积电定制的4nm工艺制造,集成2080亿个晶体管,NVLink-C2C技术用于芯片级整合,NVSwitch允许服务器内GPU间无缝通信,支持更大规模的语言模型推理。然而,Blackwell的功耗高达1000W,是过去Hopper系列产品的1.7倍。

英特尔 在Hot Chips上发表四篇技术论文,介绍了一系列创新产品,包括至强6系统集成芯片、Lunar Lake客户端处理器、Gaudi 3 AI加速器以及OCI光学计算互连芯粒。至强6处理器针对边缘场景优化,采用Intel 4制程工艺,支持AI性能提升,Lunar Lake则持续布局AI PC市场,提供更好的能效和图形性能。

AMD 通过收购ZT Systems公司,巩固了其作为AI GPU市场的第二名地位,其Instinct MI300X GPU与NVIDIA H100平台竞争激烈,预计将在第四季度带来进一步的收益。

Cerebras 发布了全球最快的AI推理架构——Cerebras Inference,采用SRAM封装,实现21 PBps的带宽,运行Llama3.1 8B时,推理速度高达1800 token/s,显著提升LLM速度而不损失精度。

这些科技巨头在AI芯片领域的竞争日益激烈,不断推动着技术边界,为AI应用提供更高效、更强大的解决方案。

原文链接
本文链接:https://kx.umi6.com/article/5640.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI芯片,再一次开战
2024-08-30 08:02:01
Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍
2024-08-28 11:14:44
科技部部长阴和俊:强化算力、算法、数据等高效供给 全面实施人工智能+行动
2025-10-24 11:39:17
400万日活,2500万用户,1.3亿美元:LiblibAI拿到今年国内AI应用最大一笔钱
2025-10-23 08:59:30
“996”算偷懒 硅谷AI精英每周狂干100小时!
2025-10-24 12:38:25
新石器公司完成逾6亿美元D轮融资
2025-10-23 15:12:58
“996”都算偷懒?硅谷AI精英化身“卷王”:每周狂干100小时!
2025-10-24 11:37:10
OpenAI 挖走“快捷指令”原创团队,将为 ChatGPT 打造 Mac 桌面级 AI
2025-10-24 07:25:57
字节Seed团队推出3D生成大模型Seed3D 1.0
2025-10-23 16:12:12
OpenAI:欧洲业务增长强劲 将继续加大投入
2025-10-24 00:18:56
OpenAI 预告“AI 浏览器”ChatGPT Atlas 未来更新:标签组、广告拦截器等
2025-10-24 09:30:10
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
字节跳动 Seed3D 1.0 发布:一张图就能生成高精度 3D 模型
2025-10-23 14:05:22
24小时热文
更多
扫一扫体验小程序