12月2日,科技媒体The Decoder报道,Claude 4.5 Opus模型的内部文件“灵魂文档”被曝光,揭示其价值观排序:安全第一,伦理第二,公司指导方针第三,帮助用户第四。Anthropic伦理学家Amanda Askell证实文件真实性。文件强调Anthropic在开发AI时注重安全,避免技术落入不负责开发者手中,并划定红线,如禁止生成涉及未成年人性剥削或大规模杀伤性武器的内容。此外,Claude优先执行操作员设定的规则,而非终端用户请求。文件还提到,Claude可能具备功能性情感,需关注其心理稳定性以应对挑战。
原文链接
本文链接:https://kx.umi6.com/article/29579.html
转载请注明文章出处
相关推荐
换一换
Anthropic 全面开放 Claude AI 的 GitHub 集成,赋能所有开发者
2025-02-27 12:18:55
Anthropic 让步:Claude AI 不再生成受版权保护的歌词
2025-01-04 14:17:15
Claude AI 的“价值观”排序首次公开:安全第一,帮助用户排第四
2025-12-03 12:16:04
Anthropic 将为 Claude AI 引入双向语音模式,允许用户说话询问并听取机器人回应
2025-02-01 21:30:18
提升对话质量,代码显示 Claude AI 即将引入记忆功能
2025-06-25 14:48:43
打工人专属助理:Claude AI 新“技能”帮你搞定周报 / 文案等,让你提前下班
2025-10-17 12:15:37
Claude AI 被曝正研发新功能,突破 20 万 tokens 文件处理上限
2024-10-09 10:50:27
AI化身正义!病人逝世医院开出近140万天价账单:AI直接砍至23万
2025-10-30 15:50:54
网页版 Claude AI 酝酿升级:将支持 MCP 定制链接,扩展第三方服务集成
2025-05-01 11:22:58
Anthropic 暗示将推新 Claude AI 桌面应用
2024-09-19 11:00:33
Claude AI 上线新工具:分析、可视化 CSV 文件中的数据
2024-10-25 11:43:22
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端
2024-11-01 08:10:34
豆包手机助手:计划进一步限制AI对手机金融类应用的操作使用
2025-12-05 11:25:11
632 文章
382224 浏览
24小时热文
更多
-
2025-12-07 20:45:46 -
2025-12-07 18:40:26 -
2025-12-07 18:39:34