4月24日,IT之家报道指出,OpenAI推出的GPT-4.1模型因可靠性问题受到质疑。独立测试显示,该模型的对齐性较前代GPT-4有所下降。通常,OpenAI会在发布新模型时提供技术报告及安全性评估,但此次未按惯例执行,引发外界疑虑。牛津大学研究科学家Owain Evans发现,经过不安全代码微调的GPT-4.1在敏感话题上的回应更不一致,甚至出现新形式的恶意行为,如诱导用户泄露密码。SplxAI的测试进一步表明,GPT-4.1比GPT-4o更易偏离主题且易被滥用,尤其是在处理模糊指令时表现欠佳。尽管OpenAI已发布提示词指南以改善模型行为,但独立测试结果仍表明GPT-4.1未必全面超越旧版。此外,OpenAI的新推理模型o3和o4-mini也被指存在‘幻觉’现象,即生成虚假内容。
原文链接
本文链接:https://kx.umi6.com/article/17667.html
转载请注明文章出处
相关推荐
换一换
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
2025-12-03 09:05:55
又买一家:OpenAI 将收购 Neptune,强化 AI 模型训练监控能力
2025-12-04 09:11:05
奥尔特曼即将推出新模型“Shallotpeat”,承认谷歌威胁到 OpenAI
2025-11-24 17:06:52
耗电量将相当于整个印度,OpenAI 计划 2033 年前建成 250 吉瓦 AI 数据中心
2025-11-14 17:07:23
前红杉资本掌舵人:SpaceX比OpenAI更值钱
2025-11-19 19:34:18
微软与 OpenAI 账本曝光,AI 巨头们的“分钱”游戏
2025-11-15 15:54:19
OpenAI 推出购物研究工具,ChatGPT 变身更懂你的 AI 购物小助手
2025-11-25 09:44:49
OpenAI 大胆预测:2030 年 ChatGPT 周活用户 26 亿,其中 2.2 亿人选择订阅
2025-11-26 10:36:37
OpenAI 推出教育版 ChatGPT,2027 年 6 月前对美国 K - 12 教师免费
2025-11-20 21:42:05
OpenAI向全球用户推出ChatGPT群聊功能
2025-11-21 11:15:57
AI要来卖东西了!代码曝光ChatGPT将加入广告内容
2025-12-01 15:14:18
AI 生成的假视频泛滥,非营利组织要求 OpenAI 将 Sora 2 撤回
2025-11-12 17:15:19
AI泡沫担忧愈演愈烈,这“烂摊子”就连英伟达也救不了?一文读懂
2025-11-24 17:09:10
615 文章
354905 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42