标题:当大模型升级速度放缓,AI Infra 创业是否仍有前景?
作者:朱可轩 编辑:陈彩娴
时至今日,清华系在中国大模型创业领域占据重要地位,AI Infra 赛道更是汇聚了清昂智能、清程极智、无问芯穹等明星企业,这些企业的创始人大多来自清华实验室。当前,AI Infra 的核心任务是将各类模型与芯片深度适配,减少算力资源闲置,实现模型应用的提速降本。
然而,AI Infra 的发展面临着诸多挑战,包括 MaaS 平台的压力、训推一体机的可行性、海内外基础设施需求的差异等问题。这些问题影响着创业公司的长远发展。例如,潞晨科技创始人尤洋认为,MaaS 平台可能会与通用大模型公司竞争,使得创业公司难以获利。
推理需求的爆发是必然趋势,预计未来三年推理成本将大幅降低。推理优化部署成为关键,但海内外企业在布局上存在分歧。一些企业选择打造 MaaS 平台,另一些则专注于硬件开发,如无问芯穹布局端侧大模型推理处理器 LPU。
在推理平台的竞争中,Together.AI 和 Lepton.AI 等公司倾向于避开与 ChatGPT 等通用大模型的竞争,转而提供差异化服务。国内创业公司如硅基流动、潞晨科技和清昂智能则选择训推一体机的交付路径,以适应市场需求。
中美市场的差异也影响了创业公司的发展策略。海外市场有成熟的订阅模式和统一的硬件标准,而国内市场则需要支持更多种类的国产芯片。国内算力资源分散,导致大量算力闲置,这为 AI Infra 创业提供了机会。
异构混训是当前的一种解决方案,但长期来看可能存在局限。尽管无问芯穹通过异构多种 GPU 卡实现高效混训,但业内普遍认为单一型号的同构集群更具优势。PPIO 派欧云等公司则看好分布式推理的潜力。
AI Infra 创业是否会与云厂产生冲突?多数观点认为,云厂与创业公司存在差异,合作空间较大。云厂擅长资源池化和共享,而创业公司则更注重分布式资源的整合。AI Infra 的关键在于解决国产算力问题,各种尝试都具有积极意义。
.png)

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21