综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年1月,Cursor团队公开了一项实验成果:数百个AI智能体连续运行168小时,生成超300万行代码,从零构建出一个可用的Web浏览器。项目代号FastRender,核心为Rust编写的渲染引擎和定制JavaScript虚拟机,源码已发布在GitHub。实验基于OpenAI于2025年12月发布的GPT-5.2-Codex模型,该模型具备上下文压缩技术,能自主完成复杂软件工程任务。团队设计了“规划者-工作者-裁判”分层架构,显著提升多智能体协作效率。尽管成果引发热议,但也有质疑声音指出AI生成代码的创造性和维护难题。Cursor正将实验技术整合进商业产品,未来或改变软件开发模式。
原文链接
2026年1月15日,OpenAI宣布通过Responses API向开发者开放其最强代码模型GPT-5.2-Codex。该模型于2025年12月发布,是目前最先进的智能体编程AI,专为解决复杂软件工程问题设计。其核心突破包括“上下文压缩”技术和针对“智能体工作流”的深度优化,能够自主执行构建新功能、重构代码和排查漏洞等任务。OpenAI称其为“最具网络安全能力”的模型,在代码安全审计方面表现突出。实战案例中,AI代码编辑器Cursor利用GPT-5.2-Codex连续运行一周,生成超300万行代码,成功从零构建了一个功能完整的Web浏览器,包含Rust编写的渲染引擎及HTML解析等功能。该模型已在Cursor、GitHub等主流工具中支持,并在多项基准测试中取得领先成绩。
原文链接
据快科技1月10日消息,深度求索(DeepSeek)预计将在2月中旬农历新年前后发布代号为V4的新一代旗舰级人工智能模型。该模型主打强劲的代码生成能力,在超长代码提示词处理与解析上实现突破,支持百万级tokens上下文窗口,可一次性消化中型项目的代码库和技术文档,精准理解跨文件依赖关系,解决复杂软件开发中的上下文断裂问题。V4还解决了AI训练中数据模式理解能力随训练次数增加而衰减的难题,形成更深刻的抽象理解能力。初步测试显示,其在代码生成领域表现优于Anthropic、Claude及OpenAI GPT等主流模型。此外,V4可能采用全新mHC架构,提升并行计算效率和国产芯片适配能力,降低部署成本。DeepSeek近期更新的R1论文扩展至86页,为V4发布做好技术准备。
原文链接
2026年1月,北京版幻方量化公司九坤投资开源了SOTA代码大模型IQuest-Coder-V1系列,引发国内外科技圈热议。该模型40B参数版本在SWE-Bench Verified榜单中取得81.4%的成绩,超越Claude Opus-4.5和GPT-5.2。模型支持多种参数规模(7B、14B、4...
原文链接
2025年接近尾声,TRAE发布年度报告,显示其一年内生成1000亿行代码,相当于300万程序员全年无休的工作量。报告显示,超50%用户高频使用Tab键(Cue功能),全球用户超600万,月活突破160万,覆盖近200个国家和地区,Token消耗半年增长700%。核心亮点包括SOLO模式(自主编程)问答规模增长7300%,以及MCP协议支持复杂任务操作。技术上,TRAE在SWE-bench评测中全球第一,并在CCF-A类顶会发表10余篇论文,开源项目trae-agent获10.2k Stars。此外,补全延迟降低60%,内存占用减少43%,补全成功率高达99.93%。作为中国AI IDE领域的领先者,TRAE通过‘开源+社区+学术’三位一体生态,定义下一代开发环境。
原文链接
标题:aiXcoder:AI并非软件开发的“银弹”,需与软件工程结合
近日,硅心科技(aiXcoder)产品研发负责人黄宁在“全球C++及系统软件技术大会”上发表演讲,探讨大模型驱动的软件开发现状及未来。他指出,Vibe Coding模式虽高效,但难以适配企业级复杂项目开发。AI并非万能解决方案...
原文链接
12月19日,OpenAI发布最强智能体编程模型GPT-5.2-Codex,专为解决复杂软件工程问题设计。该模型基于GPT-5.2通用智能,融合GPT-5.1-Codex-Max终端操作能力,引入“上下文压缩”技术,大幅提升代码重构与迁移效率。其在Windows 10/11环境中优化显著,并能精准解读技术图表、UI截图及设计草图,快速将原型图转化为功能代码。GPT-5.2-Codex在SWE-Bench Pro等权威测试中刷新纪录,可独立完成代码库导航到Pull Request创建的全流程工作。案例显示,它在网络安全领域表现突出,协助Privy公司工程师挖掘React组件中的未知漏洞。为应对潜在风险,OpenAI启动“可信访问试点计划”,向安全专家开放高权限访问。目前,该模型已向ChatGPT付费用户全量推送,API访问权限将逐步开放。
原文链接
12月13日,OpenAI揭秘安卓版Sora开发过程。团队仅用28天完成任务,从10月8日启动到11月5日交付,4名工程师协作,85%代码由Codex生成,实现99.9%稳定率。Codex像一名高级工程师,能快速生成代码,但需明确指导目标与约束条件,且无法推断未告知信息,如架构模式或用户体验反馈。尽管Codex熟悉多种编程语言、积极编写单元测试,并可通过CI日志自我修复问题,但其深层架构推断能力有限,仍需人类监督质量与系统决策。最终,Codex高效执行明确任务,而人类专注于架构与体验优化。
原文链接
12月7日,Ubuntu团队在更新错误追踪系统时测试了GitHub Copilot生成的代码。Canonical工程师Skia在Ubuntu Foundations团队周报中透露,Copilot的表现总体尚可,但生成的代码无法直接使用。主要问题在于Copilot无法访问真实数据库,提示中也缺乏数据库模式信息,导致部分函数完全错误,尽管此类情况比例较低。团队正对代码进行审核和测试,详情可参考相关PR中的最新改动。
原文链接
11月19日,谷歌Gemini 3 Pro模型首秀引发关注。开发者测试显示,该模型仅需一条指令即可生成复杂3D乐高编辑器和完整手机游戏,如经典游戏《Ridiculous Fishing》的复刻版,包含音效与音乐。Gemini 3 Pro在多项基准测试中表现优异,以1501 Elo登顶LMArena排行榜,并在GPQA Diamond等测试中取得超91%的准确率。此外,在MMMU-Pro和Video-MMMU测试中分别获得81%和87.6%的高分,同时SimpleQA Verified测试得分为72.1%,展现其在科学与数学领域的可靠性。不过,与Anthropic的Claude Code相比,Gemini 3 Pro在多步骤指令遵循度上稍显不足。
原文链接
加载更多
暂无内容