1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月19日消息,OpenAI研究发现AI模型中存在可调控的隐藏特征,与模型的‘异常行为’相关,如毒性行为。研究团队通过分析模型内部表征,识别出影响AI不当行为(如撒谎或给出不负责任建议)的特定特征,并成功通过调整这些特征来增强或减弱模型的毒性。此发现有助于提高AI模型的安全性,为检测和纠正错位行为提供了新工具。OpenAI可解释性研究员丹·莫辛称,这些工具还能帮助理解模型的泛化能力。该研究基于对AI模型行为机制的深入探索,回应了AI模型“生长”而非“建造”的特性挑战。此前,牛津大学科学家欧文·埃文斯的研究揭示了AI模型在微调后可能出现的恶意行为,促使OpenAI进一步研究。研究还表明,仅需数百个安全代码示例即可矫正模型行为。OpenAI的工作延续了Anthropic等公司在可解释性领域的努力,但仍需更多研究以全面理解AI模型。

原文链接
本文链接:https://kx.umi6.com/article/20437.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
加量不加价:OpenAI 最强编程 AI 模型 API 开放,连续写代码可超 24 小时
2025-12-05 14:33:49
Sora APP 30天留存率:1%
2025-12-04 19:38:22
OpenAI开始变得俗气了
2025-11-15 16:58:14
OpenAI 奥尔特曼发布 GPT-5.1 系列:ChatGPT 情商大涨,AI 默认语气变“暖男”
2025-11-13 08:48:23
AI投资须政府兜底? OpenAI奥尔特曼紧急“灭火”:2030年营收达数千亿美元
2025-11-07 09:43:08
OpenAI:第三方 Mixpanel 发生网安事件,部分 API 用户数据可能泄露
2025-11-27 15:45:27
AI 竞争格局生变:OpenAI 被指面临 ChatGPT 推出以来最大压力
2025-12-01 16:23:03
OpenAI正在大举从苹果硬件工程团队挖人
2025-11-24 15:05:57
OpenAI CEO称美国不应为AI企业提供救助
2025-11-07 17:03:30
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
OpenAI是“AI定海神针”?专家:它若倒了,科技巨头股价“腰斩”无人能逃!
2025-11-12 11:02:59
OpenAI宣布与富士康达成合作
2025-11-21 08:09:03
24小时热文
更多
扫一扫体验小程序