综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月3日晚,阿里开源新一代智能体编程模型Qwen3-Coder-Next,仅激活3B参数,性能媲美DeepSeek-V3.2、GLM-4.7等顶级开源模型。该模型通过智能体训练扩展创新,可边思考边编程,显著降低推理成本至同等性能模型的5%~10%,适用于家用电脑和轻量服务器等低成本场景。在SWE-Bench Verified测试中,问题解决率突破70%,并在TerminalBench 2.0等评测中表现优异。其采用大规模可验证编程任务与真实环境反馈训练,擅长处理长上下文推理、工具使用及失败恢复等复杂任务。Qwen3-Coder-Next已开源基座和指令微调两大版本,可在魔搭社区、Hugging Face免费下载商用,支持多种下游应用集成,助力轻量高效智能体编程开发。
原文链接
2026年1月15日,OpenAI宣布通过Responses API向开发者开放其最强代码模型GPT-5.2-Codex。该模型于2025年12月发布,是目前最先进的智能体编程AI,专为解决复杂软件工程问题设计。其核心突破包括“上下文压缩”技术和针对“智能体工作流”的深度优化,能够自主执行构建新功能、重构代码和排查漏洞等任务。OpenAI称其为“最具网络安全能力”的模型,在代码安全审计方面表现突出。实战案例中,AI代码编辑器Cursor利用GPT-5.2-Codex连续运行一周,生成超300万行代码,成功从零构建了一个功能完整的Web浏览器,包含Rust编写的渲染引擎及HTML解析等功能。该模型已在Cursor、GitHub等主流工具中支持,并在多项基准测试中取得领先成绩。
原文链接
8月1日,阿里通义千问发布Qwen3-Coder-Flash模型(全称Qwen3-Coder-30B-A3B-Instruct),在智能体编程、浏览器使用及工具调用等领域性能媲美GPT-4.1等闭源模型。该模型总参数量30.5B,支持262144个tokens上下文长度,优化了编码任务和函数调用能力。官方称其性能超越顶级开源模型,仅略逊于部分顶配闭源模型。这一发布进一步提升了AI智能体的应用潜力。
原文链接
加载更多
暂无内容