1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

如何消除AI幻觉?我们做了个实验

“让AI帮忙推荐楼盘,它说得有理有据,连户型都帮我选好了,我都心动了,结果它推荐的楼盘根本不存在……”

这样无奈的时刻,许多AI用户都曾经历过。AI随叫随到、无所不知,既能秒生成有理有据的小论文,又能充当心理医生抚慰情绪。然而,大家对AI的信任有时也会悄悄动摇:文中附上的链接变成乱码,严谨术语下包裹着虚构的参考文献,统计数据找不到出处……

信源的可靠性对AI回答的准确性至关重要。AI回答错误通常源于引用信源的问题。为此,我们设计实验测试五款国产AI助手(智谱清言、豆包、腾讯元宝、文心一言、Kimi),针对2014年和2024年的经济、社会、科技、文体、国际新闻事件生成介绍,统计引用来源。

结果显示,五款AI普遍引用政府机构与媒体信息,这类信源可信度较高,但部分AI会引用个人账号内容。面对较早的新闻事件,AI更依赖在线百科内容。此外,三款AI与开发机构关联紧密:豆包偏好引用今日头条和抖音百科,腾讯元宝引用微信公众号,文心一言常引用百度内容。

相比不可靠信源,幻觉更难防范。“幻觉”指AI看似真实但包含错误信息或误解语境的回应。实验将其分为四类,发现“无中生有”类幻觉最常见,占一半以上。幻觉的产生机制尚不清晰,但受训练数据偏差和算法影响,目前无法根除。

普通人如何识别幻觉?优化指令是关键。明确用词、设定回答边界、建立标注机制、分段输出并引入交叉验证可有效减少幻觉。我们通过修正指令的实验验证了这一点,在100次提问中,41次出现幻觉,其中26个幻觉被消除,占比63.4%。不同AI表现差异显著,事实诱导问题比逻辑诱导问题诱发更多幻觉,但逻辑谬误更难察觉。

2024年末,《连线》杂志警告:“人工智能的风险来自人类的滥用。”AI存在缺陷与滥用已模糊虚构与真实界限,产生新社会问题。面对AI热潮,我们需要热情拥抱的同时保持冷静和谨慎。

原文链接
本文链接:https://kx.umi6.com/article/17713.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容
2024-10-28 11:17:59
体验Kimi的新功能后,我为月之暗面捏把汗
2025-04-30 22:06:18
OpenAI 再出招反击DeepSeek,“深度研究”在这个终极测试超越R1
2025-02-03 15:14:28
又被耍了,我们给AI 喂屎,把互联网糟蹋成啥样了
2025-08-13 19:40:00
人对AI的幻觉远大于AI给人的
2025-04-28 08:41:46
AI集体出现幻觉
2024-08-22 15:39:27
“AI那么火,但我还是劝你谨慎用它”
2025-02-13 14:00:49
金・卡戴珊自曝使用 ChatGPT 备战法考:它总是答错,还害我挂科
2025-11-08 15:46:58
AI幻觉:它真的会一本正经胡说八道!
2025-02-19 18:54:46
AI幻觉真有那么可怕么?以及,致歉
2025-03-25 08:39:29
DeepSeek 向王一博道歉闹剧:AI 幻觉不是病,别治了
2025-07-11 12:36:25
Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低
2025-05-24 00:33:44
如何消除AI幻觉?我们做了个实验
2025-04-24 22:49:51
24小时热文
更多
扫一扫体验小程序