OpenAI拆开AI「黑箱」，终于可以看懂GPT在想什么了

2025-11-16 12:33:47

量子黑客

发布在

快讯

阅读：223

2025年11月，OpenAI发布新研究，通过训练稀疏神经网络破解大模型“黑箱”问题。研究人员发现，结构简单、连接稀疏的模型内部存在清晰可解释的电路，为理解AI决策机制提供全新方向。该方法通过大幅减少神经元连接，使模型计算更透明，有助于揭示大模型为何产生幻觉或失控。实验表明，稀疏模型在保持能力的同时提升了可解释性。尽管当前技术仅能解释部分行为，OpenAI计划将方法扩展至更大模型，并探索从密集模型中提取稀疏电路的技术。此研究对提升AI安全性与可信度具有重要意义。

原文链接

本文链接：https://kx.umi6.com/article/28490.html

转载请注明文章出处

可解释性