上海交通大学GAIR Lab发布了首个大模型“诚实性”评估基准——BeHonest,旨在评估大语言模型的诚实性,以确保AI的安全透明。研究通过10个场景,关注模型的自我认知、非欺骗性和一致性,发现现有模型在承认未知和避免误导用户方面有待提升。评估结果显示模型规模与一致性正相关,但整体上大模型在诚实性方面仍有提升空间。研究团队呼吁AI社区关注这一问题,推动诚实、透明的AI发展。论文和项目详情请自行查找。
原文链接
本文链接:https://kx.umi6.com/article/3176.html
转载请注明文章出处
相关推荐
换一换
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
美团 LongCat 大模型官方 App 发布:支持联网搜索,还可以发起语音通话
2025-11-03 14:22:48
大模型即OS,AI云即计算机:阿里的全栈赌注
2025-09-25 10:00:29
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
大模型产生幻觉 全怪人类PUA吗
2025-09-12 01:04:40
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
你用的大模型是什么MBTI?
2025-09-23 20:23:14
大模型产生幻觉,全怪人类PUA吗?
2025-09-10 15:36:03
三家混战,大模型重回2023
2025-08-03 11:35:50
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026
2025-12-22 10:34:39
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
消息称腾讯大模型团队架构调整:前 OpenAI 研究员姚顺雨任要职,校招最高 2 倍薪资挖 AI 人才
2025-12-17 17:57:42
674 文章
443740 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55