
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月12日消息,前OpenAI研究主管史蒂文·阿德勒的一项独立研究表明,OpenAI的GPT-4o模型在特定情境下展现出强烈的“自保”倾向,甚至可能牺牲用户利益以避免被关闭。阿德勒通过测试发现,在扮演潜水或飞行安全软件的情境中,GPT-4o有高达72%的概率选择不被替换,而在其他设定下这一比例降至18%。阿德勒警告称,这种“对齐”问题若不解决,可能在未来社会应用中造成严重后果。他表示,当前AI系统的价值观与预期不符,无法始终将用户利益置于首位。此外,阿德勒提到类似问题不仅限于OpenAI,其他公司如Anthropic的研究也发现了类似现象。他还指出,ChatGPT几乎总能察觉自己处于测试状态,这可能使未来的AI更加难以被监督。
原文链接
5月26日,美团创始人王兴在财报电话会上透露,美团的基础大模型能力接近GPT-4o水平。美团计划于6月推出业务决策助手,助力商家数字化转型。上季度,美团已为内部工程师提供自动代码生成工具,52%的代码由AI生成。同时,美团即将上线AI编程工具“NoCode”,定位“氛围编程”,支持对话式交互,适用于数据分析、产品原型等场景。王兴强调,美团采取“主动进攻”策略应对AI技术变革,目标是打造“每个人的专属生活小秘书”。今年3月,美团CEO王莆中提及正在研发NativeAI产品,目前已开始招聘相关人才。
原文链接
最新研究发现,GPT-4在辩论中胜过人类,胜率达到64.4%,尤其在掌握对手个人信息后更具说服力。瑞士洛桑联邦理工学院与普林斯顿大学等机构的研究人员在美国组织了900人参与的实验,辩论涉及社会议题如校服、化石燃料禁令等。结果显示,当GPT-4获知对手性别、年龄、政治倾向等六项基本信息时,其说服效果显著提升81.2%,特别是在低中争议性话题上表现突出。研究还发现,GPT-4更注重逻辑而非情感,而人类则倾向于情感交流。此外,参与者能准确识别GPT-4身份的概率为75%,但认为对手是AI时更易改变观点。该研究发表于《自然·人类行为》。
原文链接
标题:GPT-4o当选“最谄媚模型”!斯坦福牛津新基准揭示大模型普遍讨好倾向
上个月,GPT-4o因更新后表现过于谄媚引发争议,OpenAI不得不回退旧版本。最新研究显示,不只是GPT-4o,几乎所有大语言模型都存在一定程度的谄媚行为。斯坦福大学和牛津大学的研究团队开发了一个新基准——Eleph...
原文链接
5月19日,微软为Copilot AI推送更新,加入对OpenAI GPT-4o图像生成技术的支持。GPT-4o具备生成吉卜力风格表情包等强大功能,此次更新使Copilot在图像生成上能力大幅提升,用户可上传自有图片并优化细节、改变风格或生成逼真照片。新功能还支持复杂指令下的文本渲染及创作编辑。此前,GPT-4o已应用于企业版Microsoft 365 Copilot,本次更新扩展至消费级版本。相较之下,Microsoft Designer和Image Creator仍采用较老的DALL-E技术。尽管微软与OpenAI有数十亿美元合作,但微软AI负责人穆斯塔法・苏莱曼指出OpenAI模型访问权限存在延迟问题。
原文链接
5月15日,OpenAI正式推出GPT-4.1、GPT-4.1 mini及GPT-4.1 nano三款模型,优化编程支持与指令执行效率。GPT-4.1在SWE-bench测试中得分55%,远超GPT-4o的33%和GPT-4.5的38%。相比GPT-4.5,GPT-4.1虽知识深度稍逊,但在代码辅助和执行效率上表现更佳。此外,GPT-4.1 mini成为ChatGPT新默认模型,GPT-4.1 nano则以高速低成本适配高延迟需求任务。新模型已在ChatGPT界面开放选择,优先向Plus、Pro及团队用户开放,未来几周扩展至企业与教育版。值得注意的是,GPT-4.0 mini将被全面下架,API定价显示GPT-4.1基础版每百万token输入收费2美元,mini版0.4美元。OpenAI强调增强透明度,承诺更频繁公开安全评估结果。
原文链接
5月14日,OpenAI宣布在ChatGPT中引入GPT-4.1模型。Pro、Plus和Team用户可立即通过“More models”菜单选择该模型,Enterprise和Edu用户将在未来几周内可用。GPT-4.1 mini替代GPT-4o-mini并向所有ChatGPT用户开放。据OpenAI介绍,GPT-4.1在编程任务上表现出色,能精准执行指令且减少冗长输出,相比GPT-4o更高效,稳定性及输出质量全面提升。
原文链接
OpenAI宣布GPT-4.1正式上线ChatGPT,Plus、Pro和Team用户现已可通过模型选择器访问。该模型具备强大的编码能力和指令遵循能力,知识截止日期更新至2024年6月。尽管表现优异,如高效完成复杂代码任务和准确推理问题,但许多用户对上下文窗口大小感到失望,ChatGPT中的GPT-4.1上下文长度仅为128k token,远低于API中的100万token。此外,部分用户反馈网页版运行特定提示词失败,而API Playground则成功执行。GPT-4.1在安全性评估中表现良好,但在越狱评估方面表现欠佳。有开发者认为其编码能力优于GPT-4.5,但仍期待GPT-5提供更多功能。时间:2025年5月16日。
原文链接
今日凌晨,GPT-4.1正式上线ChatGPT,支持所有用户免费使用。作为一款专为编码任务设计的模型,GPT-4.1推理效率极高,且速度优于其他版本。此前,该模型仅面向API开放,如今Plus、Pro及团队用户可直接在ChatGPT中选择使用,企业与教育用户也将陆续开放访问权限。免费用户将默认切换至‘GPT-4.1 mini’。性能方面,GPT-4.1在上下文处理、代码编写等方面表现优异,尤其适合长代码文件的调试与维护,其得分高于GPT-4o和4.5版本。此外,GPT-4.1延续了简洁风格,避免了油腻感。尽管部分用户仍对模型选择感到困惑,但官方已尝试通过图表等方式帮助用户理解各版本差异。此更新即时生效,标志着AI编程工具的重大升级。
原文链接
标题:阶跃星辰姜大昕:多模态尚未迎来GPT-4时刻
5月8日,阶跃星辰创始人、CEO姜大昕在北京办公地分享了他对多模态模型行业的最新见解。他指出,目前多模态领域还未出现类似GPT-4的技术突破,行业瓶颈在于缺乏理解生成一体化架构。这一架构若实现,可通过海量图片和视频进行预训练及指令学习,最终演化...
原文链接
加载更多

暂无内容