AI 的下一个战场:小模型崛起
大模型热潮正逐渐降温,小模型开始崭露头角。八月初,腾讯推出“混元系列小模型”,阿里随后发布两款通义Qwen3-4B,OpenAI更开源了gpt-oss-20B等小模型。头部玩家的集体转向表明,端侧小模型正重回舞台中央。
小模型并非新概念,但这次回归的是真正落地在终端的小模型,而非停留在论文中的理论。2020年GPT-3问世后,AI进入“大力出奇迹”时代,大模型成为主流,小模型被雪藏。然而,随着数据和算力瓶颈显现,行业分化加剧,部分企业开始转向应用端,探索端侧智能。
端侧小模型的优势在于其轻量化与实用性。例如,在WAIC展会上,西门子展示了一款小于50MB的小模型,能预测冲压设备故障,避免生产线停摆。这种场景中,大模型即便算力强大也无用武之地,而小模型却能精准应对。
面壁智能是端侧小模型领域的代表企业之一。这家清华系初创公司创立于2022年,曾专注于大模型研发,但因商业化难题转而all in端侧小模型。其MiniCPM系列已迭代多次,最新版本minicpm v4.0仅8B参数,能在手机、汽车等终端稳定运行。此外,面壁还推出了基于MiniCPM的智能座舱助手cpmGO,并与多家车企达成合作,预计搭载于长安马自达MAZDA EZ-60等车型上。
面壁的成功不仅体现在技术突破,还在于场景落地。其模型已应用于点餐机器人、服务机器人、儿童玩具等多领域,展现出丰富的商业潜力。与此同时,学术界也认可其成果,《Nature Communications》收录了其关于MiniCPM-V的研究。
小模型的崛起标志着AI从追求规模转向注重实用。正如面壁内部信所言,脚踏实地解决真实需求,才是技术发展的核心方向。当大模型进入瓶颈期,端侧小模型正在以“小而美”的姿态赢得未来。
.png)

-
2025-09-06 06:30:37
-
2025-09-06 00:27:49
-
2025-09-06 00:26:52