标题:揭秘为何大模型误判“9.9<9.11”:《圣经》和日期神经元影响
MIT和UC伯克利的研究团队通过新工具揭示了大模型为何会错误判断“9.9<9.11”。这个谜团的答案令人意外——与《圣经》经文、日期、重力等概念有关。特别是,《圣经》经文相关神经元的激活被设为0后,大模型的准确率提高了21%。
这一突破由Transluce AI团队实现,他们开发了名为Monitor的可解释性界面,用于揭示和控制大模型的内部计算过程。Monitor通过神经元描述数据库、实时界面和AI代码检查器,帮助用户理解并调整语言模型的神经激活模式。通过监测和调整,研究人员发现移除与《圣经》、日期和重力相关的神经元,可以让大模型正确回答问题。
Transluce AI是一个非营利性研究实验室,旨在通过开源、可扩展的技术,提高人们对AI系统的理解,促进其服务于公共利益。该实验室的目标是创建世界级的AI理解工具,推动建立可信赖的AI行业标准。创始团队成员大多来自MIT、CMU等顶尖高校,包括Jacob Steinhardt、Sarah Schwettmann等。
Transluce AI强调工具的可扩展性和开放性,以增强公众对AI系统的信任和监督。团队已发布多个实例,如LLaMA-3.1-8B-Instruct神经元描述数据库,以及通用调查员语言模型。未来,他们将继续扩展这些工具,以理解和分析更复杂的系统。
原文链接
本文链接:https://kx.umi6.com/article/7834.html
转载请注明文章出处
相关推荐
换一换
备案平均时长缩至2个月 目前已有216款大模型在京完成备案
2026-02-28 19:46:01
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
豆包大模型2.0正式发布
2026-02-14 14:23:01
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
消息称小米研发智能问答助手产品“Mi Chat”
2025-12-09 17:51:08
美团 LongCat 大模型官方 App 发布:支持联网搜索,还可以发起语音通话
2025-11-03 14:22:48
豆包们,开始「上链接」
2025-10-27 10:54:08
开源 AI 模型 TOP5,被中国厂商包圆
2025-10-15 18:39:57
月之暗面近20天收入超去年全年
2026-02-23 19:11:04
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
736 文章
554691 浏览
24小时热文
更多
-
2026-03-19 21:39:18 -
2026-03-19 21:38:13 -
2026-03-19 21:37:07