
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,OpenAI新模型在国际数学奥林匹克竞赛(IMO)中以35分斩获金牌,超过当年金牌线。该模型在6道题中解决了5道,模拟人类考试条件完成,解题过程严谨且具有创造性。尽管第6题未解,但其表现引发广泛关注。数学家陶哲轩对此发表评论,指出缺乏统一测试标准,呼吁谨慎看待AI竞赛表现。同时,第三方平台MathArena独立评测显示其他模型远未达获奖水平。OpenAI研究员透露,此为实验性研究,GPT-5即将发布,但相关模型数月内无发布计划。事件引发热议,部分网友认为结果本身具重要意义。
原文链接
北京时间7月18日凌晨,OpenAI发布ChatGPT Agent,可自动规划执行任务、调用工具完成多环节工作。创始人山姆·阿尔特曼称其为“第一次真正感受到AGI”。ChatGPT Agent引发AI创业领域震动,有观点认为大模型可能吞噬90%的Agent市场。Manus等创业公司迅速回应,称不会退让,并发布对比测试,宣称在任务完成度和响应速度上优于ChatGPT Agent。尽管OpenAI强调其底层模型能力领先,但外界批评其输出质量粗糙、速度较慢。ChatGPT Agent团队表示这只是智能体功能集成的第一步,未来将持续更新。AI Agent市场规模预计从2024年的51亿美元增长至2030年的471亿美元,但隐私与安全问题也引发担忧,OpenAI呼吁用户谨慎使用。
原文链接
2025年7月19日,据IT之家报道,OpenAI正测试代号为gpt-5-reasoning-alpha-2025-07-13的新模型,该模型已于7月13日定稿,目前处于最终测试阶段。研究员Alexander Wei透露,GPT-5即将发布,并将融合历代技术成果打造统一系统。此外,OpenAI还在测试一款名为o3-alpha的新模型,在编程与前端设计方面表现优于此前版本。报道称,GPT-5极可能整合o3-alpha的部分能力,进一步提升性能。相关信息由网友Tibor Blaho和外媒Bleeping Computer披露,显示出GPT-5的发布已进入倒计时。
原文链接
2025年7月19日,OpenAI发布ChatGPT agent,由奥特曼带队直播展示。这一统一智能体融合了Operator、Deep Research和ChatGPT的优势,可自主完成网页浏览、数据分析、代码运行及办公软件操作等任务,并生成PPT、Excel报告。其在HLE测试中取得41.6%高分,刷新多项基准纪录,但表现仍不及马斯克的Grok 4 Heavy。ChatGPT agent现已开放Pro、Plus和Team用户使用,每月提供不同额度体验。OpenAI称其为“超级个体”模式的关键杠杆,将重塑企业组织架构,提升小团队生产力。华人学者孙之清等参与研发。
原文链接
7月18日凌晨,OpenAI推出ChatGPT Agent,引发国产AI竞品激烈回应。Manus、Genspark等公司迅速通过推文和Demo展示自家产品优势,称其更早、更快、更好用。ChatGPT Agent已向Pro用户开放,Plus和Team用户将于周一开始使用。实测显示,ChatGPT Agent能高效完成任务,如生成退休计划PPT,但结果被批简陋。与Manus、Minimax、Kimi对比发现,ChatGPT在内容深度、视觉效果上逊色,尤其Kimi表现最佳,提供详尽报告和交互体验。尽管ChatGPT Agent整合了Deep Research、Operator和对话能力,但整体更像是“补作业”。此次发布表明AI正从“回答问题”转向“执行任务”,大模型公司竞争焦点也转向人机交互主入口。
原文链接
7月18日凌晨,OpenAI发布ChatGPT Agent,这是继1月operator和2月deep research后在Agent化领域的又一重要进展。AI Agent领域现分化为两大流派:以OpenAI、Claude为代表的“基座派”,以及注重应用场景的“应用派”。3月Manus引发通用Agent热潮后,Genspark、Flowith等新锐玩家纷纷加入竞争。ChatGPT Agent发布后,Genspark和Manus公开质疑其能力,并通过对比案例展开较量。我们测试了多个AI Agent在婚礼规划与贴纸设计任务中的表现,结果显示各产品在任务执行中存在明显差异:部分如Manus能完成购物车添加,而其他多停留在信息搜集或指引阶段。尽管当前AI Agent仍处“混沌期”,但新玩家的加入和激烈竞争将推动更成熟解决方案的诞生,为复杂任务处理带来新可能。
原文链接
北京时间7月18日凌晨,OpenAI正式发布ChatGPT Agent,标志着通用智能体(Agent)能力的重大升级。ChatGPT Agent可自动规划、选择工具,完成复杂任务,如浏览日历、生成PPT、运行代码等,并支持连接Gmail、GitHub等应用。目前,该功能已向Pro、Plus和Team订阅用户开放,预计企业版和教育版用户将在夏季晚些时候获得访问权限。在基准测试中,ChatGPT Agent表现优异,例如在HLE评估中得分41.6%,远超此前模型。OpenAI CEO山姆・奥特曼称其为‘感受AGI’的时刻,但也提醒其潜在风险,建议谨慎使用。不少网友已体验其强大功能,如制定退休计划、购物等,但效率仍有改进空间。
原文链接
2025年7月18日,OpenAI正式发布ChatGPT Agent,标志着AI智能体进入全新阶段。该产品整合了“深度研究”与“操作执行”能力,可接管用户电脑,完成工作场景(如会议安排、PPT生成)和生活场景(如旅行规划、活动设计)中的复杂任务。ChatGPT Agent支持Pro、Plus和Team版用户即刻使用,企业版和教育版将于7月开放。其专用模型刷新多项性能纪录,在数据分析、电子表格编辑等任务中表现优于人类,并具备实时安全监控功能。然而,这一突破性进展对部分创业者构成冲击,或将重塑互联网生态,引领AI时代从“网站”“APP”向“Agent”为核心的全新产品形态转变。
原文链接
北京时间7月18日凌晨,OpenAI发布ChatGPT智能体,融合网页交互、深度研究和对话能力,可完成复杂多步骤任务。该智能体能够进行财务研究、制作PPT和Excel表格,甚至处理入门级投行分析师的工作,如构建财务报表模型。演示案例包括根据婚礼信息推荐服装及规划棒球赛季观赛路线,并生成可视化图表和电子表格。OpenAI强调其为初稿工具,需结合微软等软件编辑,显著减少工作量。目前暂不支持炒股等敏感操作,涉及重要任务时需用户授权。功能面向付费订阅用户,Pro用户每月可执行400次任务,其他付费用户限40次。
原文链接
2025年7月18日凌晨,OpenAI正式发布ChatGPT Agent功能,标志着AI智能体在任务执行领域的重大突破。ChatGPT Agent整合了Operator、Deep Research和ChatGPT本体,可自主完成复杂任务,如浏览网页、提取信息、运行代码、生成PPT等,并支持实时展示步骤与用户干预。Pro用户即日起可使用,每月享有400条调用额度。该功能在多项基准测试中表现领先,尤其在Humanity’s Last Exam(HLE)中刷新纪录,得分达44.4。OpenAI CEO Sam Altman称这一时刻为“感受AGI”的重要节点。ChatGPT Agent还可连接第三方应用如Gmail、GitHub,深度嵌入用户工作流,显著提升自动化能力,但设计审美等方面仍有改进空间。
原文链接
加载更多

暂无内容