1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

《科创板日报》19日消息,中国信息通信研究院人工智能所启动大模型幻觉评测项目‘可信AI’AI Safety Benchmark。该项目旨在评估大模型的幻觉现状,推动其应用发展。此次测试聚焦于大语言模型,涵盖事实性幻觉和忠实性幻觉两大类型。测试数据包含超7000条中文样本,题型涉及信息抽取、知识推理及事实判别。测试覆盖人文科学、社会科学、自然科学、应用科学和形式科学五大领域。

原文链接
本文链接:https://kx.umi6.com/article/15743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
你用的大模型是什么MBTI?
2025-09-23 20:23:14
万字回顾首届中国AI算力大会!15+位大咖主会场演讲精华爆棚,来没来都值得收藏
2025-07-04 14:44:08
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
三家混战,大模型重回2023
2025-08-03 11:35:50
当AI智能体走进诊室,大模型如何颠覆医疗?
2025-07-30 13:48:25
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
阿里巴巴CEO吴泳铭:大模型是下一代操作系统 AI Cloud是下一代计算机
2025-09-24 10:37:04
大模型隐私安全和公平性有“跷跷板”效应,最佳平衡法则刚刚找到 | 人大&上海AI Lab
2025-07-28 09:07:15
高性能计算群星闪耀时
2025-08-21 12:35:24
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
24小时热文
更多
扫一扫体验小程序