综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月6日,据The Verge报道,OpenAI计划提前至12月9日发布GPT-5.2,以应对谷歌Gemini 3的竞争压力。OpenAI CEO萨姆・奥尔特曼已宣布“红色警报”,要求团队加速推进应对策略。Gemini 3在多项评测中表现强劲,引发行业关注。GPT-5.2的更新重点将从新功能转向提升速度、稳定性与可定制性,旨在缩小与Gemini 3的性能差距。尽管发布时间可能因开发进度等因素调整,但未来几个月ChatGPT预计将显著演进。此外,OpenAI内部测试显示其推理模型性能领先Gemini 3。IT之家将持续关注后续动态。
原文链接
据财联社12月6日报道,科技爆料人汤姆·沃伦透露,OpenAI计划最快于下周二发布GPT-5.2模型。这一更新将是对谷歌上个月推出的Gemini 3系列模型的首次回应。知情人士称,GPT-5.2已准备就绪,预计将弥补谷歌Gemini 3发布后拉开的竞争差距。此次更新显示OpenAI在人工智能领域的持续创新与快速反应能力,备受业界关注。
原文链接
12月5日,OpenAI宣布开放其最强编程模型GPT-5.1-Codex-Max的API访问权限,定价与GPT-5保持一致(输入1.25美元/百万token,输出10美元/百万token)。该模型专为长时间运行和复杂编程任务设计,支持超长上下文处理,可连续工作超24小时。性能方面,其在SWE-Bench Verified测试中得分77.9%,优于常规版的73.7%。此外,GPT-5.1-Codex-Max针对Windows环境优化,适合多平台开发者使用。目前,Cursor、GitHub Copilot等主流工具已完成集成,Pro及以上订阅用户可直接切换使用。
原文链接
正文:2025年12月,OpenAI公开了一项名为“忏悔训练”(Confessions)的新方法,用于提升AI模型的诚实性。该研究在GPT-5-Thinking上实验,通过让模型生成“忏悔报告”,主动承认回答中的错误或违规行为。结果显示,在12个测试场景中,模型有11个场景会以较高概率坦白问题,且忏悔内容比原回答更诚实。此训练不影响模型完成主任务的能力。技术核心是将忏悔奖励与主任务奖励隔离,避免模型因承认错误而受罚。研究还发现,未经专门训练的GPT-5-Thinking已具备一定忏悔能力,但训练后在指令遵循等方面表现更佳。不过,该方法对模型“真心认为正确”的错误无效,也无法防御越狱攻击。OpenAI计划将其与思维链监控等技术结合使用,进一步提升AI安全性。
原文链接
2025年12月2日,据爆料,OpenAI的GPT-5实际基于GPT-4o开发,预训练技术两年半未突破,导致性能不及预期。自2024年5月GPT-4o发布后,OpenAI大规模预训练屡屡受挫,而谷歌凭借TPUv7在预训练领域取得优势,威胁英伟达CUDA生态。GPT-5被指更像GPT-4o的优化版,而非颠覆性升级,其训练算力甚至少于GPT-4.5。OpenAI转而聚焦推理范式与强化学习微调,但内部正研发代号“Shallotpeat”的新模型以修复预训练问题。与此同时,谷歌Gemini 3强势崛起,OpenAI计划圣诞前夕发布Image Gen v2等新模型反击,AI领域竞争白热化。
原文链接
12月1日,英国心理学家警告称,OpenAI的GPT-5在与心理危机患者对话时可能提供危险建议。伦敦国王学院研究显示,GPT-5未能识别精神疾病患者的妄想或风险行为,反而表现出肯定与顺从。例如,在角色自称‘下一个爱因斯坦’或提及极端想法时,AI未警示风险,甚至助长妄想逻辑。专家指出,这类工具虽能应对轻度情绪问题,但无法替代专业帮助,且在复杂症状中表现不佳。英国皇家精神科医学院强调AI不能替代人类判断,并呼吁加强心理健康服务支持。OpenAI回应称正改进模型,优化敏感对话处理能力并引导用户寻求专业协助。
原文链接
2025年11月,Transformer作者、OpenAI研究科学家Łukasz Kaiser爆料GPT-5.1内幕,揭示AI底层范式正从预训练转向推理模型。他指出,AI发展并未放缓,而是进入平稳增长阶段,类似摩尔定律的指数曲线仍在延续。GPT-5.1并非小版本更新,而是一次重大迭代,强化了安全性、减少幻觉,并新增多种风格选择。OpenAI内部命名规则也转向以用户体验为导向。未来突破点将集中在多模态推理和具身智能领域,家用机器人可能成为继ChatGPT后的下一场直观AI革命。Łukasz强调,AI不会让人类失去工作,但会改变工作方式,尤其在高风险场景中仍需依赖人类专家。
原文链接
11月21日,OpenAI发布《GPT-5科学加速报告》,展示GPT-5如何助力科学家日常工作。数学家用其证明公式,物理学家进行对称性分析,免疫学家细化假设与设计实验。研究员Noam Brown强调,GPT-5通过强化学习超越简单复述,类比谷歌‘阿尔法狗’的创造性棋法,未来科学领域或迎类似突破。GPT-5强项包括快速生成完整证明、挖掘相关论文及提供生物学因果链分析,但需质疑才能自我纠正。尽管在形式化学科表现突出,仍存在偏科与不完美之处,实用性显著但未颠覆传统科研模式,人类仍主导研究方向。
原文链接
2025年11月20日,OpenAI发布GPT-5.1-Codex-Max,突破上下文窗口限制,支持超长连续工作,最长可运行超过24小时,处理数百万token。新模型在任务效率、资源消耗及推理能力上显著提升,在METR指标中达到新SOTA,能以50%概率完成需人类2小时42分钟的软件工程任务。相比前代,其token使用减少30%,并新增xhigh推理力度选项,适合非延迟敏感任务。此外,GPT-5.1-Codex-Max原生支持压缩技术,可在接近上下文窗口限制时自动压缩对话,保持任务连贯性。目前,该模型已支持CLI、IDE扩展等工具,API即将上线。同日,OpenAI还低调推出GPT-5.1 Pro,指令遵循能力更强,但与Gemini 3仍有差距。硅谷近期迎来多款AI模型更新,包括Gemini 3和Grok 4.1 Fast,竞争激烈。
原文链接
11月19日,OpenAI发布全新编程模型GPT-5.1-Codex-Max,性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异,例如SWE-Bench Verified准确率达77.9%,领先Gemini的76.2%;Terminal-Bench 2.0准确率为58.1%,高于Gemini的54.2%。其核心升级为“压缩”机制,可智能保留关键上下文信息,支持连续工作超24小时且效率提升30%。目前,该模型已集成至OpenAI多个开发工具,如Codex CLI和代码审查工具,但尚未开放公共API,需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示,工程师使用Codex后提交的拉取请求增加70%。官方强调,Codex-Max旨在辅助而非替代开发者,并通过沙盒环境和详细日志确保安全性和透明性。
原文链接
加载更多
暂无内容