标题:中国大模型要用Infra“降本增效”
今年7月的世界人工智能大会前夕,上海浦东一家酒店举办了一场关于AI算力芯片的企业会议,吸引了两家AI Infra公司的高管参加,他们的共同目标是争取合作订单。其中一位CEO在得知对手将出席后,迅速增加了演讲机会,并成功赢得了与客户的合作。
AI Infra定位为连接算力与应用的“桥梁”,提供软件系统、数据存储和处理等技术服务,解决AI大模型应用中的计算、存储和通讯难题。当前,AI算力紧缺、美国对华高端AI算力限制等因素使得AI Infra行业快速发展,成为中国AI大模型产业不可或缺的一部分。
据中金公司报告,AI Infra产业处于高速发展阶段,未来3-5年内有望保持30%以上的年增长率。预计到2027年,全球AI市场规模将达到近1万亿美元,其中AI基础设施层的投资将达到4万亿元人民币。
多家公司纷纷发力AI Infra技术,如阿里、百度、字节跳动等。无问芯穹和硅基流动等初创公司专注于服务芯片和算力中心,提供系统和算力结构性服务。硅基流动表示,其技术使客户大模型推理业务的算力使用效率提升了90%。
AI算力需求持续增长,但成本高昂,这导致了算力供需之间的鸿沟。例如,训练GPT-3.5需要3640PFlops-days的算力,而一颗3nm芯片的成本超过2万美元。ChatGPT使用近3万颗高端GPU,成本高达数十亿美元。
AI Infra的作用在于提升算力利用率和降低算力成本,使模型训练和推理更高效。阿里云的磐久AI服务器提供AI算法预测GPU故障等功能,其PAI平台实现万卡级别的训练推理一体化,算力有效利用率超过90%。
百度智能云提供百舸AI异构计算平台,字节跳动的火山引擎支持多芯、多云架构,提供高性能算力和模型服务。AI Infra初创公司主要提供三种方案:MaaS软件解决方案、租用算力云和模型API平台,以及芯片+软件的端到端方案。
英伟达因其全功能GPU处理器和CUDA软件在AI算力服务中占据领先地位,而国内AI Infra技术和商业化规模仍需提升。面对美国对华AI算力限制,中国需通过系统化、计算体系结构化解决算力问题,推动AI基础设施建设。
无问芯穹和硅基流动等公司致力于提供高效的AI算力解决方案,助力中国AI产业发展。清华大学教授汪玉表示,全产业链自主可控是实现中国AI生态的关键。未来10年,算力将大幅提升,AI将成为推动科技进步的重要力量。
.png)

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21