1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Anthropic推出“宪法分类器”,以减少其最新大型语言模型Claude 3.5 Sonnet的越狱情况。实验结果显示,实施宪法分类器后,针对Claude模型的成功越狱率降低了81.6%,且对性能影响较小。宪法分类器将类似人类价值观的规则植入模型,防止生成有害内容。Anthropic还发起挑战让用户尝试越狱,但此举引发争议,有人质疑是在众包安全工作。尽管如此,Anthropic表示宪法分类器有效抵御了已知越狱方法,但仍需改进测试系统的误报和漏报问题。该技术于2月5日公布。

原文链接
本文链接:https://kx.umi6.com/article/12593.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI头号叛徒,竟然是自学的AI?
2025-08-22 16:48:45
Claude 接管人类电脑编程:程序员沸腾、OpenAI 反击,智能体大战一触即发
2024-10-25 23:02:57
OpenAI离职到估值千亿美元,Anthropic4年时间引硅谷巨头疯狂押注
2025-08-01 08:54:00
Claude接管人类电脑12小时:学会摸鱼,敲着敲着代码看风景去了
2024-10-23 12:32:46
美国网约车巨头 Lyft 同 Anthropic 达成合作:Claude 将为百万司机提供服务
2025-02-10 12:08:58
AI 助手 Claude 进化:无缝接入团队工具、深度研究模式挑战复杂问题
2025-05-02 15:01:11
Claude编程支持一键共享,第一批网友已经开始晒作品了
2024-07-10 16:00:00
你的iPhone 即将“换脑”,ChatGPT 和Claude 有望接管苹果AI,Siri 要变聪明了?
2025-07-01 12:54:05
GPT-4o更容易越狱?北航&南洋理工上万次测试给出详细分析
2024-06-12 15:09:32
Anthropic 推出新功能:用户可直接在 Claude 聊天机器人中构建 AI 驱动应用
2025-06-26 07:37:47
老外都在用!盘点全球最高效的十大办公AI工具
2024-07-29 10:23:27
Anthropic对苹果Siri发起致命一击
2025-05-29 15:40:29
美国AI巨头Anthropic全球封杀中国控股公司!无论何地一律禁用Claude等
2025-09-05 18:23:30
24小时热文
更多
扫一扫体验小程序