综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月14日,腾讯优图实验室正式开源通用文本表示模型Youtu-Embedding。该模型专为企业级应用设计,可广泛应用于企业客服、智能问答、内容推荐等场景,尤其适合构建RAG检索增强生成系统。Youtu-Embedding通过深度神经网络将文本映射到高维向量空间,显著提升语义理解能力,在中文文本嵌入评测基准CMTEB中以77.46分位居榜首。其核心优势包括三阶段训练流程、创新的微调框架和精细化的数据工程。模型权重、推理代码及完整训练框架已发布,首个版本含20亿参数,可在HuggingFace和GitHub获取。
原文链接
标题:无需数据配对,文本嵌入也能互通?康奈尔研究:所有模型殊途同归
无需任何配对数据,就能实现文本嵌入的模型空间转换?康奈尔大学给出了Plus版答案——vec2vec,首个无监督文本嵌入的跨向量空间转换方法。
vec2vec利用共享潜在空间,不仅保留嵌入结构和底层输入语义,还能反推提取嵌入信息。...
原文链接
加载更多
暂无内容