
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
10月16日,阿里发布全新AI编程工具Qoder CLI,开发者可通过命令行终端一键实现代码生成、调试与部署。该工具基于轻量级Agent框架,内存消耗比同类工具低70%,适合笔记本及云端沙箱运行。Qoder CLI支持Quest模式,可自主完成任务开发,并提供CodeReview功能,减少代码审查耗时50%,提升代码质量一倍。此外,内置多种工具并支持灵活扩展,满足脚本化、工具链集成等场景需求。技术负责人谢吉宝表示,未来开发将采用IDE与CLI双引擎模式,兼顾复杂任务处理与自动化能力,成为软件开发标配。
原文链接
正文:近日,京东云JoyCode-Agent在SWE-Bench Verified基准测试中以74.6%的通过率位居全球Top3,展现强大编程能力并已开源。该产品通过多智能体协作和端到端自动修复闭环,能精准解决复杂代码问题,同时降低30%-50%计算成本。全新升级的JoyCode 2.0聚焦企业级开发场景,支持代码预测、智能评审等全自动化功能,并引入规约编程与CSR上下文引擎,显著提升开发效率。目前,JoyCode已服务京东上万名研发人员,代码采纳率超50%,开发周期缩短40%。
原文链接
10月5日,OpenAI宣布启动“Codex Alpha”抢先体验计划,邀请开发者和用户提前试用其最新AI编程模型。该计划在2025年度开发者日(DevDay 2025)前上线,提供两大系列共七个层级的模型,包括专注于编程任务的gpt-5-codex系列(低、中、高级别)和具备不同程度推理能力的gpt-5系列(极简至高配)。用户可通过该计划访问新版Codex,探索轻量级任务到复杂编程难题的解决方案。这一举措旨在收集反馈并优化模型性能,为正式发布做准备。
原文链接
谷歌下一代旗舰AI模型Gemini 3.0预计下周上线,内测表现引发广泛关注。该系列包括Gemini 3.0 Pro和Gemini 3.0 Flash两个版本,其中Pro版在编程领域表现尤为惊艳。测试显示,Gemini 3.0 Pro在物理模拟、SVG图像生成等任务中表现出色,甚至超越GPT-5和Claude Sonnet 4.5等竞品。此外,它在ARC-AGI-2基准测试中准确率超20%,并在人类考试基准上取得32.4%的最高分。Flash版则以旅行规划任务中的速度和精准度备受好评。尽管尚未正式发布,Gemini 3.0已引发开发者热议,预示着AI编码新时代的到来。
原文链接
2025年10月,AI巨头OpenAI和Anthropic在产品策略上分化明显。OpenAI追求横向扩张,ChatGPT新增电商功能并与Etsy、Shopify合作,同时推出基于Sora 2的AI视频应用,目标打造“AI版TikTok”。Anthropic则专注纵向深挖,发布Claude Sonnet 4.5,定位“全球最强编程模型”,主攻企业市场并创收超5亿美元。两家公司分别代表消费级平台与专业化服务的不同路径,竞争愈发激烈。马斯克公开质疑Anthropic前景,而OpenAI估值已超Anthropic千亿美元。未来格局尚不明朗,但行业或将呈现多强并存局面。
原文链接
2025年10月1日,IEEE Spectrum发布2025年度编程语言排行榜,Python再次蝉联冠军,实现十连冠,并首次在综合排名、增长速度和就业导向三个板块同时问鼎,成为榜单12年来首个“三冠王”。Python因简洁性、丰富的库支持以及AI领域的广泛应用,进一步巩固其地位。相比之下,JavaScript从前三跌至第六,SQL虽受冲击但仍具价值。与此同时,程序员社区文化因AI崛起而衰落,Stack Overflow活跃度显著下降。未来,随着AI介入编程,语言多样性可能减少,底层架构设计与算法选择仍是核心能力,编程语言或将逐渐退场,但代码逻辑依然重要。
原文链接
9月30日,Anthropic发布Claude Sonnet 4.5,称其为“全球最佳编程AI模型”。新模型突破性地支持“生产就绪级”应用开发,显著提升软件开发可靠性。Claude Sonnet 4.5在多项行业基准测试中表现领先,并能在企业试用中自主编程超30小时,完成复杂任务如数据库搭建和安全审计。科技巨头苹果、Meta等已采用Claude系列模型。面对OpenAI GPT-5的竞争压力,Anthropic推出配套智能体开发工具包(Claude Agent SDK),助力开发者定制AI智能体。行业合作伙伴评价该模型擅长处理长周期复杂任务,更像“一位同事”。
原文链接
2025年9月30日,Anthropic正式发布Claude Sonnet 4.5,号称史上最强编程AI模型。在SWE-bench Verified测试中,该模型登顶业界第一,并在OSWorld基准测试中取得61.4%的成绩,远超此前记录。Claude 4.5能连续工作超30小时,可一次性生成1.1万行代码,大幅提升复杂任务处理能力。新增功能包括「检查点」保存、VS Code插件支持及Claude Agent SDK开放,助力开发者构建智能体。Anthropic强调其对齐度和安全性显著改进,减少不当行为和提示注入攻击风险。此外,临时功能「Imagine with Claude」允许实时生成软件代码,但仅对Max订阅用户开放五天。此次发布被视为与OpenAI等对手竞争的重要举措,同时旨在挽回此前因性能问题流失的用户。
原文链接
9月24日,蚂蚁集团支付宝体验技术部正式开源智能编程助手Neovate Code。该工具可深度理解代码库,遵循编码习惯,精准实现功能开发、Bug修复和代码重构,集成Code Agent核心能力。其主要功能包括对话式开发、自定义规则文件、跨会话继续工作、支持多种模型提供商(如OpenAI、Anthropic等)、斜杠命令、计划模式、无头模式、插件扩展、Git工作流等。目前以CLI工具形式提供,未来将支持IDE扩展、Web应用等多种客户端形态,适配更多开发场景,提升开发者效率。
原文链接
2025年9月,Scale AI发布新基准SWE-BENCH PRO,显示GPT-5、Claude Opus 4.1和Gemini 2.5等顶级模型编程任务解决率均未超25%。然而,深入分析发现,GPT-5在已提交任务中准确率达63%,远高于Claude的31%。新测试集严格规避数据污染问题,包含多元化代码库与复杂任务,强调真实工业场景挑战。尽管如此,即使是表现最佳的GPT-5,在商业场景中的解决率也低于20%。研究人员指出,编程语言难度、代码库特性及模型种类显著影响结果,而各模型失败原因各异,如语义理解不足或上下文管理局限。未来谁能突破30%解决率仍是未知数。
原文链接
加载更多

暂无内容