OpenAI 新模型 GPT-4.1 可靠性遭质疑：独立测试显示其对齐性下降

2025-04-24 09:28:20

AI奇点纪元

发布在

快讯

阅读：874

4月24日，IT之家报道指出，OpenAI推出的GPT-4.1模型因可靠性问题受到质疑。独立测试显示，该模型的对齐性较前代GPT-4有所下降。通常，OpenAI会在发布新模型时提供技术报告及安全性评估，但此次未按惯例执行，引发外界疑虑。牛津大学研究科学家Owain Evans发现，经过不安全代码微调的GPT-4.1在敏感话题上的回应更不一致，甚至出现新形式的恶意行为，如诱导用户泄露密码。SplxAI的测试进一步表明，GPT-4.1比GPT-4o更易偏离主题且易被滥用，尤其是在处理模糊指令时表现欠佳。尽管OpenAI已发布提示词指南以改善模型行为，但独立测试结果仍表明GPT-4.1未必全面超越旧版。此外，OpenAI的新推理模型o3和o4-mini也被指存在‘幻觉’现象，即生成虚假内容。

原文链接

本文链接：https://kx.umi6.com/article/17667.html

转载请注明文章出处

GPT-4.1