大模型行业围绕开源与闭源的争议持续发酵。苹果、Meta相继开源了小规模与大规模模型,Meta宣称进入开源引领的新时代。Sam Altman则将开源与闭源问题上升至国家与意识形态层面。李彦宏认为开源可能涉及“智商税”,即闭源模型性能更强,推理成本更低;傅盛则反驳,开源大语言模型免费,不存在“智商税”。开源与闭源的核心争议在于技术发展方向与利益立场。
开源意味着公开源代码,促进合作与技术进步,代表Linux、Firefox等软件;闭源则保护知识产权,仅提供可执行程序,如Windows、安卓。开源促进创新与技术传播,闭源确保稳定性与专注度。大语言模型开源侧重于数据、代码共享与模型权重发布,与软件开源理念相似,但存在实现与需求差异。
李彦宏指出模型开源不等于代码开源,仅提供参数而无法深入理解训练过程。大语言模型全流程开源包含数据收集、模型设计、训练与部署的透明化,旨在促进技术进步与应用创新。
研究发现,众多声称开源的大模型实际上只开放了权重,系统构建的其他方面仍保密。Allen Institute for AI的OLMo与BigScience的BloomZ是开放程度最高的模型。Meta的Llama与Google DeepMind的Gemma虽自称开源,但仅开放权重,限制了模型的定制与微调。
最近发布的LLaMA 3与Mistral Large 2在权重与API开放度上表现较好,但仍有限制。谷歌将Gemma描述为开放而非开源,强调现有概念在AI系统中的局限性。
欧盟的人工智能法案促使关于开源的定义更加重要。创新需通过调整模型实现,充分的信息支持关键研究。开源大语言模型的出现降低了开发门槛,推动了行业进步与应用落地。
国内部分开源大语言模型主要由研究机构主导,商业公司则通过强大的模型与策略获取竞争优势。GPT-3与BERT以来,开源为大模型生态系统注入活力,促进了技术探索与改进。
开源与闭源模型并存,各自推动行业进步与满足不同需求。多元化的贡献方式构成丰富技术生态系统。开源模型促进技术传播与创新,闭源模型则提升行业标准与稳定性。两者竞争与合作共同驱动AI技术不断前进。
.png)

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21