标题:大模型套壳往事
华为盘古大模型被指套壳阿里云Qwen事件,再次引发了关于“原研”与“套壳”的讨论。回顾三年前,ChatGPT掀起大模型热潮时,“套壳”还停留在小作坊通过API包装ChatGPT、卖会员牟利的阶段。而一些自研企业虽有架构基础,却在微调阶段借力ChatGPT或GPT-4生成的数据,以提升训练质量。这种“数据蒸馏”方式成为行业公开的秘密。
2023年,大模型进入开源时代,基于开源框架开发成为创业团队的首选。然而,套壳行为也随之增多,争议不断涌现。例如,讯飞星火和DeepSeek V3曾因模型回复带有“GPT味”而被质疑套壳。对此,企业解释为训练数据污染或主动使用OpenAI生成的数据。字节跳动也曾因利用微软OpenAI API生成数据训练模型引发风波,但回应称仅用于测试。
开源时代,套壳的边界变得模糊。百川智能、零一万物等公司因模型与LLaMA架构相似而陷入争议。尽管部分团队强调创新,但类似斯坦福LLaMA3V直接抄袭面壁智能MiniCPM的事件,则暴露了恶劣套壳问题。开源降低了开发门槛,推动行业快速发展,但也带来了合规与道德难题。
业内人士指出,套壳并非完全负面。利用开源技术可加速中小团队的研发进程,专注于特定领域优化。然而,关键在于企业的宣传是否透明。若依赖开源却不承认,反而宣称自研,则会引发信任危机。知识产权法律界也表示,目前套壳行为处于灰色地带,界定难度较大。
总之,开源促进了技术创新,但企业在享受便利的同时,需明确标注技术来源,避免误导公众。“套壳”与“自研”并非绝对对立,关键在于如何平衡效率与诚信。
原文链接
本文链接:https://kx.umi6.com/article/21713.html
转载请注明文章出处
相关推荐
.png)
换一换
腾讯在线视频BU管理机制升级:专门成立了AI影视表达工作室
2025-06-11 17:19:49
全球“机器人竞赛”进入白热化,美企敦促政府设立联邦机构扶持行业
2025-03-27 21:08:00
ChatGPT深夜更新:Mac版支持“读屏编程”,Windows版全员可用了
2024-11-15 17:35:47
478 文章
78132 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21