1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA

蚂蚁AlignXplore+团队提出了一种基于文本的用户建模新范式,解决了大模型个性化中的关键问题。传统方法依赖ID Embedding或特定参数(如LoRA)表示用户偏好,但这些方式不可解释且难以迁移。相比之下,AlignXplore+通过自然语言总结用户偏好,实现了透明、通用的个性化方案。

为什么选择“文本”?

传统的向量或参数表示是“黑盒”,存在两大痛点:
1. 不可解释性:用户无法理解或修改系统定义的自己,这在隐私敏感的AI时代不可接受。
2. 无法迁移:向量和参数与特定模型绑定,导致用户画像无法跨任务或跨模型使用。

团队提出以文本作为通用接口,将用户偏好归纳为可读、可控的语言描述。这种方法不仅解耦了偏好推理与下游任务,还能无缝适配不同模型(如GPT、Llama等),实现真正的跨任务和跨模型通用。

AlignXplore+的核心特性

  1. 全域通用:整合异构数据源(如社交网络发帖、电商平台点击等),生成完整的用户画像。
  2. 极致迁移:一次生成的用户偏好可直接应用于多种任务和模型,无需重新训练。
  3. 实战适配:基于旧摘要和新交互不断演化,适应真实世界中充满噪点的数据环境。

技术框架

AlignXplore+采用两阶段训练框架:
1. SFT阶段:通过“生成-验证-合并”流程创建高质量训练数据,确保偏好总结能准确预测用户行为。
2. RL阶段:引入强化学习,设计课程剪枝和累积奖励机制,优化长期推理能力。

性能表现

尽管仅有8B参数,AlignXplore+在推荐、回复选择和生成等九大基准测试中全面超越20B/32B开源模型,平均得分75.10%,提升4.2%。其Zero-shot迁移能力尤为突出,生成的用户偏好可跨任务、跨模型使用,适应不完美数据场景。

面向未来

AlignXplore+展示了“文本即接口”的潜力,但团队认为这只是开始。未来研究方向包括:
- 流式推理的极限优化。
- 挖掘更全面的用户行为。
- 构建通用的个性化推理引擎。

相关链接
Arxiv: https://arxiv.org/pdf/2601.04963
GitHub: https://github.com/AntResearchNLP/AlignXplorePlus
Huggingface: https://huggingface.co/VanillaH1/AlignXplore-Plus

原文链接
本文链接:https://kx.umi6.com/article/32418.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
蚂蚁用8B小模型构建用户“话”像,跨任务跨模型通用且SOTA
2026-01-31 20:59:18
华泰证券:2026年AI赋能与产品创新将成为科技消费企业的重要增长点
2026-03-17 08:15:10
独家|百度健康“DoctorClaw”将于近期上线 内部正在加紧调试
2026-03-16 18:21:54
阿里“悟空”上线!钉钉给企业送来龙虾大军
2026-03-18 11:02:47
AI安全引关注 网络安全建设待升级
2026-03-17 08:14:05
被315点名的万亿隐秘生意:“污染”DeepSeek
2026-03-16 18:20:37
元宝派支持接入OpenClaw,限免“一键创建”OpenClaw活动近期上线
2026-03-17 02:51:56
XR公司VITURE与英伟达等推出XR-AI解决方案
2026-03-17 11:26:59
一人公司爆火 银行坐不住了
2026-03-17 15:42:29
Thoma Bravo联创:一些软件公司在抛售潮中遭受了“不合理的”打击
2026-03-18 09:00:10
月内公募机构调研超1200次 AI相关个股成焦点
2026-03-17 08:12:59
百度龙虾全家桶火速上桌!出手就是全球最大搜索skill
2026-03-17 21:05:29
黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元
2026-03-17 22:09:46
24小时热文
更多
扫一扫体验小程序