1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:清华孙茂松团队 × 深言科技:以解释作为训练信号,让 8B 模型在幻觉检测上反超闭源大模型

正文:
大语言模型的幻觉问题仍是其实际应用的主要障碍。即便有文档和检索结果支持,模型仍可能生成与事实不符的内容,且表达流畅、自洽,难以察觉。这对法律、医疗等高可靠性场景构成显著风险。尽管业内尝试通过更大模型、复杂检索和安全对齐缓解问题,但成本高昂,且幻觉产生的原因及检测方法仍未解决。

清华大学孙茂松团队联合深言科技提出新论文《FaithLens》,将幻觉检测从简单分类提升为对推理过程与证据一致性的整体评估。核心思路是:模型不仅判断是否存在幻觉,还需生成清晰、具体的解释,并将“解释是否有用”作为训练信号优化模型。

研究团队设计了一套结合监督微调和强化学习的框架,通过合成数据、解释过滤和奖励机制,使模型学会说明依据和推理过程。实验表明,仅 8B 参数规模的 FaithLens 在多个跨领域幻觉检测任务中超越多款闭源大模型(如 GPT-4.1、Claude 3.7 等),并在解释质量和推理一致性方面表现优异。

FaithLens 的优势体现在四个方面:精度、稳定性、解释性和计算成本。其参数规模小,推理成本显著低于闭源模型,同时性能更优。此外,FaithLens 的解释生成质量也优于多数模型,能具体指出幻觉原因,如“文档中不存在该事实”或“因果关系错误”。

训练框架分为两阶段:冷启动监督微调(SFT)和基于规则的强化学习(RL)。SFT 阶段利用现成推理模型生成合成数据,并通过三重过滤机制控制数据质量;RL 阶段引入预测正确奖励、解释质量奖励和格式奖励,使模型兼顾判断准确性和解释质量。

这项研究的意义在于将幻觉检测从黑箱判别转变为透明可解释的推理评估,解决了先进模型成本高、小模型质量不足的矛盾,并提出以解释功能性衡量质量的新思想,具有广泛推广价值。

成果背后,清华大学孙茂松教授团队长期致力于自然语言处理和大模型研究,推动中文 NLP 技术进入国际前列,同时注重技术转化与社会服务,为教育、文化等领域提供重要支持。

论文地址:https://arxiv.org/pdf/2512.20182

原文链接
本文链接:https://kx.umi6.com/article/31602.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Nature重磅:大模型的谎言如何“破”?牛津团队提出新方法,无需人工监督或特定领域知识
2024-06-20 10:12:05
清华孙茂松团队 × 深言科技:以解释作为训练信号,让 8B 模型在幻觉检测上反超闭源大模型
2026-01-14 11:43:39
浙大彭思达团队 × 理想最新研究:直面高分辨率深度的细节缺失
2026-01-14 11:45:08
摩尔线程联合智源完成RoboBrain 2.5的全流程训练
2026-01-13 19:52:12
苹果、高通争相抢购高端电子级玻璃纤维布
2026-01-14 11:46:15
巴菲特的自动扶梯,直击AI投资狂潮的要害
2026-01-13 11:41:05
穆迪:预计数据中心未来五年投资或达3万亿美元
2026-01-12 21:59:21
催化事件不断 AI应用从“可用”迈向“好用”
2026-01-13 07:19:44
国内首个农业开源大语言模型“司农”发布
2026-01-13 14:39:49
北大卢宗青团队新作:超 70% 实机成功率,支持语言指令的功能性抓取系统
2026-01-14 11:42:15
江苏:到2030年新一代智能终端、智能体等应用普及率90%以上 人工智能产业规模超万亿元
2026-01-13 15:43:00
Windows 11强推AI:用户忍无可忍!开发浏览器扩展疯狂嘲讽
2026-01-13 16:47:40
机构:2030年活跃Agent数量将快速攀升至22.16亿
2026-01-12 21:58:23
24小时热文
更多
扫一扫体验小程序