综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月5日,OpenAI宣布开放其最强编程模型GPT-5.1-Codex-Max的API访问权限,定价与GPT-5保持一致(输入1.25美元/百万token,输出10美元/百万token)。该模型专为长时间运行和复杂编程任务设计,支持超长上下文处理,可连续工作超24小时。性能方面,其在SWE-Bench Verified测试中得分77.9%,优于常规版的73.7%。此外,GPT-5.1-Codex-Max针对Windows环境优化,适合多平台开发者使用。目前,Cursor、GitHub Copilot等主流工具已完成集成,Pro及以上订阅用户可直接切换使用。
原文链接
2025年11月,Transformer作者、OpenAI研究科学家Łukasz Kaiser爆料GPT-5.1内幕,揭示AI底层范式正从预训练转向推理模型。他指出,AI发展并未放缓,而是进入平稳增长阶段,类似摩尔定律的指数曲线仍在延续。GPT-5.1并非小版本更新,而是一次重大迭代,强化了安全性、减少幻觉,并新增多种风格选择。OpenAI内部命名规则也转向以用户体验为导向。未来突破点将集中在多模态推理和具身智能领域,家用机器人可能成为继ChatGPT后的下一场直观AI革命。Łukasz强调,AI不会让人类失去工作,但会改变工作方式,尤其在高风险场景中仍需依赖人类专家。
原文链接
2025年11月20日,OpenAI发布GPT-5.1-Codex-Max,突破上下文窗口限制,支持超长连续工作,最长可运行超过24小时,处理数百万token。新模型在任务效率、资源消耗及推理能力上显著提升,在METR指标中达到新SOTA,能以50%概率完成需人类2小时42分钟的软件工程任务。相比前代,其token使用减少30%,并新增xhigh推理力度选项,适合非延迟敏感任务。此外,GPT-5.1-Codex-Max原生支持压缩技术,可在接近上下文窗口限制时自动压缩对话,保持任务连贯性。目前,该模型已支持CLI、IDE扩展等工具,API即将上线。同日,OpenAI还低调推出GPT-5.1 Pro,指令遵循能力更强,但与Gemini 3仍有差距。硅谷近期迎来多款AI模型更新,包括Gemini 3和Grok 4.1 Fast,竞争激烈。
原文链接
11月19日,OpenAI发布全新编程模型GPT-5.1-Codex-Max,性能超越谷歌Gemini 3 Pro。新模型在多项编程基准测试中表现优异,例如SWE-Bench Verified准确率达77.9%,领先Gemini的76.2%;Terminal-Bench 2.0准确率为58.1%,高于Gemini的54.2%。其核心升级为“压缩”机制,可智能保留关键上下文信息,支持连续工作超24小时且效率提升30%。目前,该模型已集成至OpenAI多个开发工具,如Codex CLI和代码审查工具,但尚未开放公共API,需订阅ChatGPT Plus等付费计划使用。OpenAI内部数据显示,工程师使用Codex后提交的拉取请求增加70%。官方强调,Codex-Max旨在辅助而非替代开发者,并通过沙盒环境和详细日志确保安全性和透明性。
原文链接
2025年11月,谷歌发布Gemini 3 Pro模型,性能大幅提升,多项基准测试超越GPT-5.1和Claude 4.5,包括AGI测试ARC-AGI-2及AIME 2025数学考试满分。其在用户投票竞技场中迅速反超马斯克的Grok 4.1,引发奥特曼与马斯克点赞祝贺。Gemini 3不仅擅长编程、多模态处理,还能完成复杂现实任务,如模拟管理自动售货机实现高收益。谷歌同步推出智能体开发平台Google Antigravity,支持多模型协作,简化开发者工作流,已吸引大量开发者试用。此次更新还包括Gemini整合进搜索、独立APP上线,以及即将推出的Gemini 3 Deep Think模式。谷歌称预训练尚未结束,未来仍有改进空间。
原文链接
11月12日,OpenAI发布GPT-5.1版本,包括GPT-5.1 Instant(即时版)和GPT-5.1 Thinking(思维版)。新版本注重用户交互体验,提供多种对话风格选项如“专业”“坦诚”“古怪”等,并优化了语气调整功能。GPT-5.1 Instant更亲切自然,指令执行能力提升,支持自适应推理技术,在数学和编程测试中表现优异。GPT-5.1 Thinking则根据问题难度灵活调整响应速度,复杂任务解释更清晰。旧版GPT-5将保留三个月供用户过渡。然而,此次更新被批评为过于迎合情绪需求,偏离技术核心,更多关注‘好好说话’而非解决实际问题,被认为‘俗气’且缺乏惊喜感。
原文链接
2025年11月13日,OpenAI发布GPT-5.1模型,主打更智能、对话性更强的特点,强调‘说人话’和情绪价值。新版本包括两个子模型:GPT-5.1 Instant适用于日常快速对话,GPT-5.1 Thinking专注于复杂推理任务。相比旧版,新模型语气更自然温暖,指令遵循能力显著提升,并引入自适应推理技术以优化响应质量。此外,用户可自定义AI语气风格,新增八种预设人格选项及动态调整功能。本周内,新模型将逐步向所有用户免费开放,旧版GPT-5过渡期为三个月。网友实测显示,GPT-5.1表现出更强的个性化和幽默感,回应离谱问题时兼具劝导与创意建议。
原文链接
2025年11月13日,OpenAI发布ChatGPT新模型GPT-5.1,主打更智能、更具对话性。升级版包括两个子模型:GPT-5.1 Instant适用于日常快速响应,GPT-5.1 Thinking专攻复杂推理场景。新模型强调情感化表达和指令遵循能力,语气风格可自定义,回答更温暖且富同理心。本周内逐步向用户免费开放,优先提供给付费用户,旧版GPT-5过渡期为三个月。此外,OpenAI新增个性化设置功能,用户可调整AI语气、简洁度等特性,并引入八种预设人设选项。网友实测显示,GPT-5.1在应对离谱问题时表现出幽默与实用性,进一步提升了用户体验。
原文链接
11月13日,OpenAI发布GPT-5.1系列模型,包括GPT-5.1 Instant和GPT-5.1 Thinking两款新模型,本周起向付费用户推送,免费用户稍后覆盖。新模型默认语气更热情、对话感更强,Instant版优化指令遵循能力,Thinking版提升复杂任务推理效率。新增“自适应推理”机制,能动态调整思考时间,快速响应简单问题,深入分析复杂问题。同时,输出风格扩展至八种预设选项,并支持用户微调语气偏好,如简洁度、热情度等。旧版GPT-5将在三个月后停用,期间保留供用户过渡。OpenAI称此次升级旨在让ChatGPT更智能、互动更有趣,满足超8亿用户的多样化需求。
原文链接
加载更多
暂无内容