大模型套壳往事

2025-07-14 18:26:03

大模型套壳往事

未来编码者

发布在

科普

阅读：244

标题：大模型套壳往事

华为盘古大模型被指套壳阿里云Qwen事件，再次引发了关于“原研”与“套壳”的讨论。回顾三年前，ChatGPT掀起大模型热潮时，“套壳”还停留在小作坊通过API包装ChatGPT、卖会员牟利的阶段。而一些自研企业虽有架构基础，却在微调阶段借力ChatGPT或GPT-4生成的数据，以提升训练质量。这种“数据蒸馏”方式成为行业公开的秘密。

2023年，大模型进入开源时代，基于开源框架开发成为创业团队的首选。然而，套壳行为也随之增多，争议不断涌现。例如，讯飞星火和DeepSeek V3曾因模型回复带有“GPT味”而被质疑套壳。对此，企业解释为训练数据污染或主动使用OpenAI生成的数据。字节跳动也曾因利用微软OpenAI API生成数据训练模型引发风波，但回应称仅用于测试。

开源时代，套壳的边界变得模糊。百川智能、零一万物等公司因模型与LLaMA架构相似而陷入争议。尽管部分团队强调创新，但类似斯坦福LLaMA3V直接抄袭面壁智能MiniCPM的事件，则暴露了恶劣套壳问题。开源降低了开发门槛，推动行业快速发展，但也带来了合规与道德难题。

业内人士指出，套壳并非完全负面。利用开源技术可加速中小团队的研发进程，专注于特定领域优化。然而，关键在于企业的宣传是否透明。若依赖开源却不承认，反而宣称自研，则会引发信任危机。知识产权法律界也表示，目前套壳行为处于灰色地带，界定难度较大。

总之，开源促进了技术创新，但企业在享受便利的同时，需明确标注技术来源，避免误导公众。“套壳”与“自研”并非绝对对立，关键在于如何平衡效率与诚信。

原文链接

本文链接：https://kx.umi6.com/article/21713.html

转载请注明文章出处

大模型