中科大与华为发布生成式推荐大模型,可在国产昇腾NPU上部署。在信息爆炸的时代,推荐系统已成为生活的重要组成部分。Meta提出的生成式推荐范式HSTU,将参数扩展至万亿级别,取得显著成果。
中科大与华为合作开发的推荐大模型部署方案适用于多种场景。报告总结了推荐范式的演变历程,指出具备扩展定律的生成式推荐范式是未来趋势。研究复现并分析了不同架构的生成式推荐模型及其扩展定律,通过消融实验揭示了HSTU扩展定律的来源,并使SASRec具备扩展性。HSTU在复杂场景和排序任务中的表现及扩展性得到验证,团队对未来研究方向进行了展望。
研究发现,具备扩展定律的生成式推荐范式正成为未来趋势。团队对比了HSTU、Llama、GPT和SASRec四种基于Transformer的架构,结果显示HSTU和Llama在参数扩展时性能显著提升,而GPT和SASRec扩展性不足,原因在于缺乏专为推荐任务设计的关键组件。
为探究HSTU等模型的可扩展性来源,团队进行了消融实验,发现相对注意力偏移(RAB)至关重要。通过引入HSTU的RAB并调整SASRec的残差连接方式,SASRec展现出良好扩展性。HSTU在多域、多行为和辅助信息等复杂场景中表现优异,在排序任务中也优于传统模型。
团队还研究了负采样率、评分网络架构及embedding维度对性能的影响,发现推荐大模型的扩展定律受垂直扩展和水平规模共同影响。未来研究将聚焦数据工程、Tokenizer、训练推理效率等领域,拓宽应用场景。
论文链接:https://arxiv.org/abs/2412.00714
主页链接:https://github.com/USTC-StarTeam/Awesome-Large-Recommendation-Models
原文链接
本文链接:https://kx.umi6.com/article/16752.html
转载请注明文章出处
相关推荐
换一换
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
智谱AI今日正式上市,一文讲透你想知道的6件事
2026-01-09 21:35:10
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
Manus救不了Meta
2026-01-08 20:35:12
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
上海:推动医疗器械相关垂类大模型研发应用
2025-09-15 16:02:14
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
2026-03-03 11:54:49
马年4大顶流模型会师阿里云Coding Plan开工!Token量大管饱,自由切换真香
2026-02-26 00:01:12
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
豆包大模型2.0正式发布
2026-02-14 14:23:01
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
长三角一体化大模型发布 AI将为区域发展提供决策支撑
2026-01-12 09:40:07
660 文章
482709 浏览
24小时热文
更多
-
2026-03-03 17:20:47 -
2026-03-03 17:19:41 -
2026-03-03 17:18:36