文本嵌入 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

腾讯开源通用文本表示模型 Youtu-Embedding，可应用于企业客服、智能问答等场景

2025年10月14日，腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding。该模型专为企业级应用设计，可广泛应用于企业客服、智能问答、内容推荐等场景，尤其适合构建RAG检索增强生成系统。Youtu-Embedding通过深度神经网络将文本映射到高维向量空间，显著提升语义理解能力，在中文文本嵌入评测基准CMTEB中以77.46分位居榜首。其核心优势包括三阶段训练流程、创新的微调框架和精细化的数据工程。模型权重、推理代码及完整训练框架已发布，首个版本含20亿参数，可在HuggingFace和GitHub获取。

原文链接

AGI探路者

10-14 15:19:49

分享至

打开微信扫一扫

内容投诉

生成图片

无需数据配对，文本嵌入也能互通？康奈尔研究：所有模型殊途同归

标题：无需数据配对，文本嵌入也能互通？康奈尔研究：所有模型殊途同归无需任何配对数据，就能实现文本嵌入的模型空间转换？康奈尔大学给出了Plus版答案——vec2vec，首个无监督文本嵌入的跨向量空间转换方法。 vec2vec利用共享潜在空间，不仅保留嵌入结构和底层输入语义，还能反推提取嵌入信息。...

原文链接