1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B

无需蒸馏任何大规模语言模型,小模型也能自给自足、联合提升?上海人工智能实验室与中国人民大学联合提出的GRA框架(Generator–Reviewer–Adjudicator)正是这样一种新范式。该方法以“多人协作”、“角色分工”为核心理念,探索多开源小模型如何通过协同机制生成高质量训练数据。

实验结果显示,在涵盖数学、代码、逻辑推理、通识问答等10个主流数据集上,GRA生成的数据质量与单个大型语言模型(如Qwen-2.5-72B-Instruct)输出相当或更高,并在多数任务中取得显著领先。

GRA框架模拟学术顶会审稿流程,小模型分工合作确保数据质量。具体分为三步:Generator生成新样本,Reviewer严格评审,Adjudicator仲裁分歧。此外,后处理模块进一步提升样本质量。

实验验证显示,GRA生成的数据在多项任务中表现优异,甚至优于大模型蒸馏数据,证明了小模型协同机制的成本效益和扩展潜力。GRA框架已在GitHub开源,可广泛应用于高效数据合成场景。

原文链接
本文链接:https://kx.umi6.com/article/20324.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI开战小模型,GPT-4o mini成本再降60%
2024-07-19 20:41:17
苹果WWDC,AI小模型的批发时代
2024-06-17 11:24:38
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
2024-07-21 15:48:06
不用千亿参数也能合成高质量数据!这个开源框架让小模型“组团逆袭”,7B性能直追72B
2025-06-17 17:26:00
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
大模型时代结束?大佬齐预测:AI模型或需先缩小规模,才能再次扩大规模
2024-07-22 21:56:10
小模型站起来了,浏览器里跑出SOTA,抱抱脸:快逃,合成数据不是未来
2024-08-19 14:34:33
20K合成数据就能让大模型能力飙升!还能实现模型自我迭代,上海AI Lab数据合成新范式
2025-01-23 15:20:08
2025 AI指数报告:没有一家独大,“小而美”大有可为
2025-04-17 14:39:15
AI明星企业血战小模型,成本暴降还更省电费,加速AI普及
2024-07-22 22:17:53
更小更强大的 GPT-4o mini 背后,AI 模型的未来不再是越大越好
2024-07-29 16:36:14
OpenAI开卷小模型,价格战杀手锏来了
2024-07-23 21:19:16
Hugging Face 研究“AI 降本增效”:给予更长运算时间让低成本小模型输出比拟大模型准确结果
2024-12-29 16:56:31
24小时热文
更多
扫一扫体验小程序