1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年,AI算力市场将迎来重大转变。随着行业从“训练模型”转向“模型推理”,推理基础设施的需求将显著增加。这意味着大模型需通过AI推理才能广泛应用,AI工作负载格局也将发生变化。据巴克莱研报,AI推理计算需求将快速增长,预计占通用人工智能总计算需求的70%以上,甚至可能超过训练计算需求的4.5倍。

2025年,这些变化将为专注推理的“小”芯片公司提供发展空间。例如,Groq、SambaNova和Positron AI等公司纷纷向英伟达发起挑战。Groq由前谷歌TPU团队成员创办,其LPU号称“世界最快推理”,并拥有超低的token成本。尽管Groq创始人声称LPU速度比英伟达GPU快10倍,但实际应用中成本和能耗仍需优化。

SambaNova以50亿美元估值位居AI芯片初创公司榜首,其RDU架构在性能上具有明显优势。SambaNova还提供定制技术堆栈,包括芯片到服务器系统,甚至大模型部署。SambaNova联创Rodrigo Liang强调,公司重心在于帮助企业高效扩展规模,推动从训练到推理的转变。

Positron AI成立于2023年,致力于降低AI推理成本,使其更加普及。Positron CEO Thomas Sohmers表示,公司将通过提供更多专用于推理的计算资源,推动“链式思维”等能力的广泛应用。

面对挑战,英伟达也在努力保持领先。近期推出的B300系列提升了大模型的推理性能,增加了显存容量。英伟达还在多个领域构建定制芯片,计划发布新一代人形机器人芯片Jetson Thor。面对竞争,英伟达依然占据主导地位。

原文链接
本文链接:https://kx.umi6.com/article/11157.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
量产元年将至 人形机器人2025年展望:产业扩张期蕴藏哪些新机?
2024-12-08 15:08:50
困扰18亿人的“全球干旱”,被AI更准确预测了
2024-10-28 11:48:11
黄仁勋放话:中国AI市场3年内达500亿美元!AI救了旧金山,整个世界急于与AI互动
2025-05-07 12:06:27
24小时热文
更多
扫一扫体验小程序