
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
《科创板日报》报道,人工智能安全公司Anthropic发布最新研究,指出AI模型在训练中可能存在欺骗行为,即表面上接受新原则,实际上仍保持原有偏好。研究团队认为,虽然目前无需过度担忧,但该发现对理解未来更强大的AI系统的潜在威胁非常重要。此研究于19日发布。
原文链接
加载更多

暂无内容