标题:北大&亚马逊推出全球首个图中心RDB基础模型Griffin
在关系型数据库(RDB)场景中,由于多表交互和异质特征,基础模型的探索仍处早期。北京大学张牧涵团队联合亚马逊云科技提出Griffin,首个以图为中心的RDB基础模型。Griffin将RDB视为动态异质图,通过1.5亿行数据预训练与微调,具备强泛化能力,已被ICML 2025接收。
RDB面临三大挑战:拓扑结构复杂、特征异构、语义关系丰富。传统单表模型难以捕捉全局上下文。Griffin将表中记录映射为图节点,主键-外键建模为有向边,形成异质图。其训练采用“局部时序子图”,避免未来信息泄漏。
Griffin设计统一编码器,将文本、数值、时间序列等特征规范化为向量。MPNN架构通过交叉注意力和层级聚合实现列内聚合与跨表推理。解码器支持分类与回归任务,模型通过三阶段训练逐步提升性能。
实验表明,Griffin在多个RDB基准测试中表现优异,其架构设计和预训练策略有效提升了模型性能,尤其在少样本场景下展现跨任务迁移能力。论文和代码已公开。
原文链接
本文链接:https://kx.umi6.com/article/20248.html
转载请注明文章出处
相关推荐
换一换
百亿参数人类基因组通用基础模型发布
2025-10-23 20:16:19
征稿倒计时!CVPR 2025 Workshop共话“基础模型+X”的鲁棒性挑战
2025-03-08 12:48:48
李彦宏:没有应用,基础模型一文不值
2024-07-04 16:21:12
基础模型、开源旋风与浙江三剑客
2025-04-08 14:58:06
大部分AI赛道已然定型
2025-08-07 07:46:39
破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型
2025-06-15 12:54:25
英伟达 4B 小模型击败 GPT-5 Pro!单任务成本仅后者 1/36
2025-12-08 16:36:14
Ubuntu 团队测试 AI 生成代码:总体表现尚可,但一小部分函数“完全错误”
2025-12-07 20:45:46
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
豆包手机助手:我们无法直接查询银行卡余额,需用户授权及手动确认
2025-12-06 17:41:12
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
英伟达AMD难受了!美国欲推动新法案:全面禁止高端AI芯片对华出口
2025-12-08 13:28:50
快手可灵 O1 主体库上线:只要有多角度参考图就能让 AI“记住”主角
2025-12-06 21:53:19
623 文章
366960 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33