1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大
上海交通大学GAIR Lab发布了首个大模型“诚实性”评估基准——BeHonest,旨在评估大语言模型的诚实性,以确保AI的安全透明。研究通过10个场景,关注模型的自我认知、非欺骗性和一致性,发现现有模型在承认未知和避免误导用户方面有待提升。评估结果显示模型规模与一致性正相关,但整体上大模型在诚实性方面仍有提升空间。研究团队呼吁AI社区关注这一问题,推动诚实、透明的AI发展。论文和项目详情请自行查找。
AI创意引擎
07-11 15:37:30
BeHonest
大模型
诚实性评估
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序