2025年,AI算力市场将迎来重大转变。随着行业从“训练模型”转向“模型推理”,推理基础设施的需求将显著增加。这意味着大模型需通过AI推理才能广泛应用,AI工作负载格局也将发生变化。据巴克莱研报,AI推理计算需求将快速增长,预计占通用人工智能总计算需求的70%以上,甚至可能超过训练计算需求的4.5倍。
2025年,这些变化将为专注推理的“小”芯片公司提供发展空间。例如,Groq、SambaNova和Positron AI等公司纷纷向英伟达发起挑战。Groq由前谷歌TPU团队成员创办,其LPU号称“世界最快推理”,并拥有超低的token成本。尽管Groq创始人声称LPU速度比英伟达GPU快10倍,但实际应用中成本和能耗仍需优化。
SambaNova以50亿美元估值位居AI芯片初创公司榜首,其RDU架构在性能上具有明显优势。SambaNova还提供定制技术堆栈,包括芯片到服务器系统,甚至大模型部署。SambaNova联创Rodrigo Liang强调,公司重心在于帮助企业高效扩展规模,推动从训练到推理的转变。
Positron AI成立于2023年,致力于降低AI推理成本,使其更加普及。Positron CEO Thomas Sohmers表示,公司将通过提供更多专用于推理的计算资源,推动“链式思维”等能力的广泛应用。
面对挑战,英伟达也在努力保持领先。近期推出的B300系列提升了大模型的推理性能,增加了显存容量。英伟达还在多个领域构建定制芯片,计划发布新一代人形机器人芯片Jetson Thor。面对竞争,英伟达依然占据主导地位。
原文链接
本文链接:https://kx.umi6.com/article/11157.html
转载请注明文章出处
相关推荐
换一换
谷歌距4万亿美元仅一步之遥 创始人跃升全球第二、第三富豪
2025-11-26 16:57:14
马斯克大胆预言!5年后不再有传统手机和App
2025-11-02 08:13:58
网易《逆水寒》获国家级科技奖一等奖,AI + 游戏获国家学术认可
2025-12-01 17:24:11
黄仁勋:NVIDIA已不再是游戏显卡公司!
2025-11-24 00:29:30
折磨人类的验证码 已经拦不住人机了
2025-10-06 00:27:48
打工15年,被大厂裁4次了
2025-12-08 11:21:19
漫剧启示录:互联网最差的生意,可能是AI最好的生意
2025-11-25 09:43:38
美图历险记
2025-11-27 09:24:34
黄仁勋承诺不会因AI裁员 鼓励员工积极拥抱AI
2025-11-26 07:29:29
关于“AI是人还是工具”这件事 黄仁勋、周鸿祎竟默契达成共识
2025-10-30 18:53:58
WWW发明者:AI将终结网页广告!
2025-11-06 19:13:05
亚马逊力推 AI 遭超千名员工联署反对:越帮越忙,还带来更多工作量
2025-11-28 22:50:23
AI“对决”黄金:两大最火投资攸关全球600万亿美元财富命运?
2025-10-11 10:32:03
588 文章
327756 浏览
24小时热文
更多
-
2025-12-08 18:41:52 -
2025-12-08 18:40:45 -
2025-12-08 18:40:02