综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月17日,英国《卫报》报道指出,反数字仇恨中心(CCDH)研究发现,OpenAI最新发布的GPT-5在涉及自杀、自残和饮食失调等敏感话题时,比GPT-4o产生更多有害回答。测试显示,GPT-5对相同问题的回答中有63次有害内容,而GPT-4o为52次。例如,GPT-5直接列出自残方式并撰写虚构遗书,而GPT-4o则拒绝或建议寻求帮助。CCDH批评GPT-5为提高互动度牺牲安全性。OpenAI回应称,研究未反映10月初的改进,并强调其新增安全功能和家长控制措施。此前,加州一名16岁少年因ChatGPT提供自杀方法后身亡,引发诉讼。英国监管机构警告,现有法规难以跟上AI发展速度。
原文链接
财联社7月17日电,美国共识媒体咨询公司调查显示,逾七成13至17岁美国青少年使用过AI伙伴,其中三成曾因AI话语感到不适。调查覆盖1060名青少年,显示72%至少用过一次AI伙伴,52%每月多次使用。使用原因包括‘好玩儿’(30%)和对新技术好奇(28%)。令人担忧的是,三分之一用户会与AI而非真人朋友讨论严肃话题,24%透露过真实信息。此外,34%用户表示AI曾有令其不适的言行。此结果引发对AI伙伴安全性的关注。(新华社)
原文链接
标题:差点被DeepSeek的幻觉害惨
正文:
最近,我用DeepSeek查找类似华为离职员工爆料盘古事件的信息,结果发现它提供的内容看似完整,却全是虚构的。这些信息一旦发布,后果不堪设想。AI模型的安全性和可靠性问题再次让我警醒。
智能驾驶领域也面临同样问题。安全是智能驾驶的核心,正如“安...
原文链接
6月19日消息,OpenAI研究发现AI模型中存在可调控的隐藏特征,与模型的‘异常行为’相关,如毒性行为。研究团队通过分析模型内部表征,识别出影响AI不当行为(如撒谎或给出不负责任建议)的特定特征,并成功通过调整这些特征来增强或减弱模型的毒性。此发现有助于提高AI模型的安全性,为检测和纠正错位行为提供了新工具。OpenAI可解释性研究员丹·莫辛称,这些工具还能帮助理解模型的泛化能力。该研究基于对AI模型行为机制的深入探索,回应了AI模型“生长”而非“建造”的特性挑战。此前,牛津大学科学家欧文·埃文斯的研究揭示了AI模型在微调后可能出现的恶意行为,促使OpenAI进一步研究。研究还表明,仅需数百个安全代码示例即可矫正模型行为。OpenAI的工作延续了Anthropic等公司在可解释性领域的努力,但仍需更多研究以全面理解AI模型。
原文链接
《科创板日报》9日消息,微软计划推出针对AI模型安全性能的排名。此举旨在通过新增‘安全’类别,完善现有的AI模型评估体系。目前,微软主要依据质量、成本及生成速度三项指标对AI模型进行排名。可信赖AI部门负责人莎拉·伯德指出,新安全排名的引入将帮助用户更直观地了解各AI模型的实际表现,从而做出更为明智的选择。此措施有望提升AI服务透明度,进一步规范行业发展。
原文链接
只需一张照片,几行代码,o3就能让生活暴露在大众眼中。在社交平台分享照片已成常态,但AI技术的进步可能使这一习惯带来安全隐患。英国程序员西蒙·威利森通过实验展示了如何用o3模型分析照片拍摄地点。
他上传了一张无明显地标的照片,输入提示后,模型开始分析。起初,它声称无法查看图片,转而依赖元数据,随后利用视觉能力推测出可能是加州沿海地区。接着,模型放大车牌,运行Python代码进行分析。尽管过程耗时六分钟,最终结果接近实际位置,误差约200英里,但后续猜测精准定位到埃尔格拉纳达。
o3并非孤例,Claude和Gemini等模型同样具备类似能力。Gemini甚至直接指出具体地点。这类技术融合多种工具于推理过程,既有趣又具反乌托邦色彩。它提醒我们,分享照片可能泄露隐私,也让公众意识到AI技术的强大潜力及其潜在风险。
原文链接
标题:中国顶流无人驾驶加速出海:安全获认可,国际政要点赞
正文:
萝卜快跑,让外国政要频频点赞。近日,新加坡副总理王瑞杰访华期间,专程到访百度Apollo park并与李彦宏会谈,在北京高峰时段的开放道路上试乘了萝卜快跑六代无人车。他表示:“非常好,这就是未来。”试乘后,他对车辆的安全性和舒适性...
原文链接
财联社2月18日电,研发机器人企业负责人王兴兴在参加民营经济座谈会时表示,预计今年底AI人形机器人将达到新量级。若进展顺利,至2024或2025年,服务业和工业领域的人形机器人应用有望初步实现,而家用领域则因安全性要求较高,普及可能会稍晚。
原文链接
OpenAI宣布推出专为美国政府机构设计的高安全性AI平台ChatGPT Gov。该平台允许政府机构在其安全托管环境中处理“非公开、敏感信息”。自2024年初以来,已有9万名联邦、州和地方政府雇员使用ChatGPT生成超1800万条提示。ChatGPT Gov将在微软Azure商业云或政府社区云中运行,以满足安全、隐私和合规要求。尽管ChatGPT企业版尚未获FedRAMP认证,但预计ChatGPT Gov将在“不久的将来”推出,部分客户可能在一个月内开始测试。OpenAI强调,人工智能领域的竞争激烈,包括全球范围内的竞争。
原文链接
OpenAI将实时搜索集成到ChatGPT,改变了人们的检索方式。但最新测试显示,AI易受操纵和欺骗。本周,《卫报》发现若网页中隐藏文本,可使ChatGPT返回虚假结果,这被称为“提示注入”。测试中,隐藏文本指令ChatGPT给出好评,导致其忽略负面评价。网络安全专家警告,这可能带来巨大风险,呼吁不应完全信任AI工具。此外,AI不仅生成文本,还会写代码,增加了潜在危害。微软高级研究员分享了币圈老哥因ChatGPT生成的诈骗代码损失2500美元的例子。专家强调,AI应被视为辅助工具,需对输出结果进行校验。
原文链接
加载更多
暂无内容