1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:推荐场景Scaling Law来了!中科大&华为诺亚方舟联合推出

当Scaling Law应用于推荐场景,模型又将如何表现?中科大认知智能全国重点实验室陈恩红团队联合华为诺亚方舟实验室推出了“推荐模型性能定律”,首次对模型性能与模型、数据的规模和质量进行了定量分析。

论文首次尝试对推荐大模型性能扩展定律给出明确的定量预测。与传统大模型扩展定律中的数据量指标不同,研究团队考虑了推荐领域的数据特性,提出了序列数据质量衡量指标,并从模型性能预测角度避免了因参数增大导致的过拟合问题。最终,基于提出的推荐大模型性能预测定律,能够在给定的数据集和模型配置下,有效预测模型的扩展潜力,同时实现模型参数的最优性能配置。

研究团队提出的新定律,能够定量预测模型的层数和物品嵌入维度对性能的影响。为应对数据质量研究不足的问题,引入了近似熵(ApEn)作为评价数据质量的创新性指标,将扩展定律中的数据规模替换为数据规模与近似熵之比,并通过理论和实验验证了这一替代的合理性。

研究人员还对提出的大模型性能预测定律进行了应用实验,成功预测了模型的最优性能参数配置和扩展潜力。近似熵值越高,数据的重复率越高。为避免概念混淆,研究采用ApEn′=1/ApEn作为近似熵的最终测度,并引入数据平均最小编码长度作为数据质量衡量指标。

验证实验表明,模型损失曲线与扩展法则高度一致,数据参数D’与ApEn的组合呈现明确的线性关系,证明了理论的有效性。应用实验进一步展示了性能法则中包含的衰减项有助于实现全局最优解。在小规模实验上,模型的扩展潜力和最优结果均得到了预测和验证。

更多细节请参考原论文。论文链接: https://arxiv.org/abs/2412.00430

原文链接
本文链接:https://kx.umi6.com/article/16492.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华泰证券:长期看好AI算力需求的持续增长
2025-07-28 08:07:00
ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
2025-04-28 11:48:41
GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,只需要工程
2024-11-11 16:48:08
OpenAI大改下代大模型方向,scaling law撞墙?AI社区炸锅了
2024-11-13 14:37:38
对话智谱CEO张鹏:大家对大模型期待过高,Scaling Law还有很大增长空间
2024-11-29 13:53:52
又到年底,那些AGI预言“实现”到哪一步了?
2024-11-26 08:24:17
技术进展放缓,是普通人AI革命的开始
2024-12-25 13:03:33
在“推荐就是一切”的时代,选择还属于我们吗?
2025-05-08 18:38:37
微软CTO:AI大模型的“Scaling Law”还能走多远?
2024-07-12 07:50:49
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
2024-11-14 15:15:44
OpenAI附议Ilya预训练终结!“但Scaling Law还没死”
2024-12-16 11:32:52
特想聊聊快手这次的变化
2025-06-25 08:43:51
2025年AI十大趋势预测
2024-12-27 08:52:59
24小时热文
更多
扫一扫体验小程序