1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年,AI算力市场将迎来重大转变。随着行业从“训练模型”转向“模型推理”,推理基础设施的需求将显著增加。这意味着大模型需通过AI推理才能广泛应用,AI工作负载格局也将发生变化。据巴克莱研报,AI推理计算需求将快速增长,预计占通用人工智能总计算需求的70%以上,甚至可能超过训练计算需求的4.5倍。

2025年,这些变化将为专注推理的“小”芯片公司提供发展空间。例如,Groq、SambaNova和Positron AI等公司纷纷向英伟达发起挑战。Groq由前谷歌TPU团队成员创办,其LPU号称“世界最快推理”,并拥有超低的token成本。尽管Groq创始人声称LPU速度比英伟达GPU快10倍,但实际应用中成本和能耗仍需优化。

SambaNova以50亿美元估值位居AI芯片初创公司榜首,其RDU架构在性能上具有明显优势。SambaNova还提供定制技术堆栈,包括芯片到服务器系统,甚至大模型部署。SambaNova联创Rodrigo Liang强调,公司重心在于帮助企业高效扩展规模,推动从训练到推理的转变。

Positron AI成立于2023年,致力于降低AI推理成本,使其更加普及。Positron CEO Thomas Sohmers表示,公司将通过提供更多专用于推理的计算资源,推动“链式思维”等能力的广泛应用。

面对挑战,英伟达也在努力保持领先。近期推出的B300系列提升了大模型的推理性能,增加了显存容量。英伟达还在多个领域构建定制芯片,计划发布新一代人形机器人芯片Jetson Thor。面对竞争,英伟达依然占据主导地位。

原文链接
本文链接:https://kx.umi6.com/article/11157.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI带动需求爆发 A股产业链上下游公司“喜报”连连
2025-09-01 07:12:06
AI 冲击就业:报告称 2025 英国初级职位招聘数较 2022 年降低 32%
2025-07-02 12:05:19
AI芯片公司Groq大幅下调今年收入预期
2025-07-30 14:48:03
苹果遭遇AI危机,供应商在逃离“果链”中进退两难
2025-07-21 18:21:33
美国现在最贵的,是中国AI 人才:清北中科大学霸正在“统治”硅谷AI 圈
2025-07-02 19:44:10
马斯克最新访谈:第一性原理是超能力
2025-07-11 08:32:25
Figma股价热情仅存1天
2025-08-12 14:18:53
腾讯高管解读 Q2 财报:会继续加大 AI 投资
2025-08-13 23:43:40
库克你赶紧退休,放过苹果吧
2025-07-08 15:51:49
美图靠AI半年赚了4亿 创始人:真正的对手不是大厂是初创
2025-08-19 11:58:38
社交平台 X 剖析社区注释:提高事实核查效率同时,存扩散错误信息风险
2025-07-03 09:16:23
知名量化分析师:世界太复杂,AI无法帮你挑选股票
2025-07-09 12:04:12
AI让你失业,也成了你唯一的安慰者
2025-07-08 17:53:22
24小时热文
更多
扫一扫体验小程序