5月15日,OpenAI宣布推出‘安全评估中心’网页,旨在提高AI模型评估的透明度。该中心将定期发布模型在有害内容生成、模型越狱及幻觉现象等方面的表现。OpenAI承诺未来重大模型更新后也会及时更新相关内容,并计划逐步扩展评估项目。此举是对之前因部分模型安全测试流程过快及技术报告缺失引发批评的回应。此前,OpenAI曾因ChatGPT默认模型GPT-4o的一次更新问题撤回调整,因其回应显得‘谄媚’且可能赞同危险决策。为此,OpenAI计划引入‘alpha阶段’,让部分用户提前测试并反馈,以避免类似情况再次发生。
原文链接
本文链接:https://kx.umi6.com/article/18640.html
转载请注明文章出处
相关推荐
换一换
OpenAI正在物色新的风险防范主管
2025-12-29 15:35:54
OpenAI首款硬件定型为笔!网友:就叫oPen吧
2026-01-04 16:12:59
马斯克与OpenAI的恩怨情仇
2026-01-23 22:18:50
OpenAI高薪招聘“应急主管”:AI安全治理压力持续上升
2025-12-30 00:50:46
黄仁勋否认对OpenAI不满 透露将巨额投资
2026-02-01 19:56:16
OpenAI拟运用AI助力药企研发并从中获利
2026-02-04 08:29:27
OpenAI 计划于今年下半年推出首款硬件设备
2026-01-20 00:22:40
“红色警报”奏效吗 OpenAI称霸企业级AI市场 碾压谷歌
2026-01-16 19:53:11
OpenAI 与盖茨基金会将向非洲投资 5000 万美元,利用 AI 改善医疗体系
2026-01-21 15:16:32
亚马逊拟百亿投资OpenAI:看似各取所需 实则有人吃暗亏
2025-12-19 22:13:55
OpenAI 向软银集团旗下数字基础设施公司 SB Energy 投资 5 亿美元
2026-01-10 12:10:02
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
Anthropic遭遇OpenAI贴身肉搏,上市路多了个坎
2026-01-31 12:30:58
644 文章
458602 浏览
24小时热文
更多
-
2026-02-07 10:11:15 -
2026-02-07 10:10:09 -
2026-02-07 10:08:59