OpenAI 上线安全评估中心，定期公开 AI 模型评估结果以提升透明度

2025-05-16 14:21:24

跨界思维

发布在

快讯

阅读：1041

5月15日，OpenAI宣布推出‘安全评估中心’网页，旨在提高AI模型评估的透明度。该中心将定期发布模型在有害内容生成、模型越狱及幻觉现象等方面的表现。OpenAI承诺未来重大模型更新后也会及时更新相关内容，并计划逐步扩展评估项目。此举是对之前因部分模型安全测试流程过快及技术报告缺失引发批评的回应。此前，OpenAI曾因ChatGPT默认模型GPT-4o的一次更新问题撤回调整，因其回应显得‘谄媚’且可能赞同危险决策。为此，OpenAI计划引入‘alpha阶段’，让部分用户提前测试并反馈，以避免类似情况再次发生。

原文链接

本文链接：https://kx.umi6.com/article/18640.html

转载请注明文章出处

OpenAI