1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

上海交通大学GAIR Lab发布了首个大模型“诚实性”评估基准——BeHonest,旨在评估大语言模型的诚实性,以确保AI的安全透明。研究通过10个场景,关注模型的自我认知、非欺骗性和一致性,发现现有模型在承认未知和避免误导用户方面有待提升。评估结果显示模型规模与一致性正相关,但整体上大模型在诚实性方面仍有提升空间。研究团队呼吁AI社区关注这一问题,推动诚实、透明的AI发展。论文和项目详情请自行查找。

原文链接
本文链接:https://kx.umi6.com/article/3176.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
蚂蚁密算开源高阶程序HOP框架
2025-07-27 16:06:47
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
阿里云副总裁叶杰平:大模型已呈现“周级迭代”爆发态势
2025-07-27 13:59:57
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
2025-06-27 15:08:34
万字回顾首届中国AI算力大会!15+位大咖主会场演讲精华爆棚,来没来都值得收藏
2025-07-04 14:44:08
我国大模型数量超1500个
2025-07-27 23:04:18
大模型驱动算力革命 AI芯片迎破局新机遇
2025-09-18 07:47:51
一场对抗OpenAI们的“危险游戏”,值不值得投资
2025-07-23 08:46:29
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
独家|阶跃星辰正进行新一轮融资 金额超5亿美元
2025-07-25 22:31:59
关于 AI Infra 的一切
2025-08-11 19:08:22
24小时热文
更多
扫一扫体验小程序