1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

蚂蚁AlignXplore+团队提出了一种基于文本的用户建模新范式,解决了大模型个性化中的关键问题。传统方法依赖ID Embedding或特定参数(如LoRA)表示用户偏好,但这些方式不可解释且难以迁移。相比之下,AlignXplore+通过自然语言总结用户偏好,实现了透明、通用的个性化方案。

为什么选择“文本”?

传统的向量或参数表示是“黑盒”,存在两大痛点:
1. 不可解释性:用户无法理解或修改系统定义的自己,这在隐私敏感的AI时代不可接受。
2. 无法迁移:向量和参数与特定模型绑定,导致用户画像无法跨任务或跨模型使用。

团队提出以文本作为通用接口,将用户偏好归纳为可读、可控的语言描述。这种方法不仅解耦了偏好推理与下游任务,还能无缝适配不同模型(如GPT、Llama等),实现真正的跨任务和跨模型通用。

AlignXplore+的核心特性

  1. 全域通用:整合异构数据源(如社交网络发帖、电商平台点击等),生成完整的用户画像。
  2. 极致迁移:一次生成的用户偏好可直接应用于多种任务和模型,无需重新训练。
  3. 实战适配:基于旧摘要和新交互不断演化,适应真实世界中充满噪点的数据环境。

技术框架

AlignXplore+采用两阶段训练框架:
1. SFT阶段:通过“生成-验证-合并”流程创建高质量训练数据,确保偏好总结能准确预测用户行为。
2. RL阶段:引入强化学习,设计课程剪枝和累积奖励机制,优化长期推理能力。

性能表现

尽管仅有8B参数,AlignXplore+在推荐、回复选择和生成等九大基准测试中全面超越20B/32B开源模型,平均得分75.10%,提升4.2%。其Zero-shot迁移能力尤为突出,生成的用户偏好可跨任务、跨模型使用,适应不完美数据场景。

面向未来

AlignXplore+展示了“文本即接口”的潜力,但团队认为这只是开始。未来研究方向包括:
- 流式推理的极限优化。
- 挖掘更全面的用户行为。
- 构建通用的个性化推理引擎。

相关链接
Arxiv: https://arxiv.org/pdf/2601.04963
GitHub: https://github.com/AntResearchNLP/AlignXplorePlus
Huggingface: https://huggingface.co/VanillaH1/AlignXplore-Plus

原文链接
本文链接:https://kx.umi6.com/article/32418.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA
2026-01-31 20:59:18
以色列专家与企业代表看好以中人工智能合作机遇
2026-01-29 19:37:55
纳米漫剧流水线公测上线,开启漫剧工业化生产时代
2026-01-29 19:35:57
磅旗科技2026全新AI战略重磅发布
2026-01-31 12:32:17
AI+能源发展大会在京举办
2026-01-31 18:54:00
iPhone炸场、Gemini助攻,苹果AI时代真来了?
2026-01-31 12:35:31
最近,启明创投拿下5个人工智能IPO
2026-01-30 13:41:19
白银狂奔,被AI「重新定价」的世界
2026-01-30 13:34:21
Clawdbot零基础接入钉钉,手把手教你把私人AI搬到聊天
2026-01-29 15:24:35
SAIR年度峰会即将开幕,陶哲轩等顶尖科学家共议AI如何重塑科研未来
2026-01-30 13:25:02
Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
2026-01-29 14:21:07
天下苦CUDA久矣,又一国产方案上桌了
2026-01-30 22:53:26
Meta 万亿豪赌「AI 未来」
2026-01-30 13:42:29
24小时热文
更多
扫一扫体验小程序