标题:推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
当Scaling Law应用于推荐场景,模型又将如何表现?中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出了“推荐模型性能定律”,首次对模型性能与模型、数据的规模和质量进行了定量分析。
论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。与传统大模型扩展定律中的数据量指标不同,研究团队考虑了推荐领域的数据特性,提出了序列数据质量衡量指标,并从模型性能预测角度避免了因参数增大导致的过拟合问题。最终,基于提出的推荐大模型性能预测定律,能够在给定的数据集和模型配置下,有效预测模型的扩展潜力,同时实现模型参数的最优性能配置。
研究团队提出的新定律,能够定量预测模型的层数和物品嵌入维度对性能的影响。为应对数据质量研究不足的问题,引入了近似熵(ApEn)作为评价数据质量的创新性指标,将扩展定律中的数据规模替换为数据规模与近似熵之比,并通过理论和实验验证了这一替代的合理性。
研究人员还对提出的大模型性能预测定律进行了应用实验,成功预测了模型的最优性能参数配置和扩展潜力。近似熵值越高,数据的重复率越高。为避免概念混淆,研究采用ApEn′=1/ApEn作为近似熵的最终测度,并引入数据平均最小编码长度作为数据质量衡量指标。
验证实验表明,模型损失曲线与扩展法则高度一致,数据参数D’与ApEn的组合呈现明确的线性关系,证明了理论的有效性。应用实验进一步展示了性能法则中包含的衰减项有助于实现全局最优解。在小规模实验上,模型的扩展潜力和最优结果均得到了预测和验证。
更多细节请参考原论文。论文链接: https://arxiv.org/abs/2412.00430
原文链接
本文链接:https://kx.umi6.com/article/16492.html
转载请注明文章出处
相关推荐
.png)
换一换
GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,只需要工程
2024-11-11 16:48:08
微软CTO:AI大模型的“Scaling Law”还能走多远?
2024-07-12 07:50:49
钛动科技陈德品:Scaling Law在营销应用中也适用,AIGC内容正在催生爆款 | MEET2025
2024-12-26 12:31:35
推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出
2025-03-31 15:35:17
千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
2025-04-30 20:23:36
技术进展放缓,是普通人AI革命的开始
2024-12-25 13:03:33
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
2024-12-17 13:02:03
苹果发现模型蒸馏Scaling Law!教师模型并非越强越好
2025-02-14 16:41:33
又到年底,那些AGI预言“实现”到哪一步了?
2024-11-26 08:24:17
深度解读:AI产业10大分歧
2024-08-25 13:19:51
2025年AI十大趋势预测
2024-12-27 08:52:59
当购物用上大模型!阿里妈妈首发世界知识大模型,破解推荐难题
2025-05-01 01:05:06
Scaling Law不适用于投资行业?朱啸虎在2024WAIC再度“语出惊人”
2024-07-08 08:32:08
514 文章
237826 浏览
24小时热文
更多

-
2025-10-23 11:04:07
-
2025-10-23 11:03:14
-
2025-10-23 11:03:01