2月3日晚,阿里开源新一代智能体编程模型Qwen3-Coder-Next,仅激活3B参数,性能媲美DeepSeek-V3.2、GLM-4.7等顶级开源模型。该模型通过智能体训练扩展创新,可边思考边编程,显著降低推理成本至同等性能模型的5%~10%,适用于家用电脑和轻量服务器等低成本场景。在SWE-Bench Verified测试中,问题解决率突破70%,并在TerminalBench 2.0等评测中表现优异。其采用大规模可验证编程任务与真实环境反馈训练,擅长处理长上下文推理、工具使用及失败恢复等复杂任务。Qwen3-Coder-Next已开源基座和指令微调两大版本,可在魔搭社区、Hugging Face免费下载商用,支持多种下游应用集成,助力轻量高效智能体编程开发。
原文链接
本文链接:https://kx.umi6.com/article/32569.html
转载请注明文章出处
相关推荐
换一换
豆包提出全新稀疏模型架构 UltraMem,推理成本较 MoE 最高可降 83%
2025-02-12 13:32:45
推理成本打到1元/每百万token,浪潮信息撬动Agent规模化的“最后一公里”
2025-12-26 15:45:08
OpenAI到底亏了多少钱?
2024-08-05 15:55:09
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
直指端侧痛点 豆包向推理算力又“砍了一刀”:新模型架构最高降本83%
2025-02-12 14:35:40
DeepSeek 突围奥秘曝光:一招 MLA 让全世界抄作业,150 + 天才集结,开出千万年薪
2025-02-01 15:24:17
阿里千问开源Qwen3-Coder-Next模型
2026-02-04 08:31:48
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
2025-09-29 15:09:28
美国AI春晚,一盆凉水浇在Agent身上
2025-12-10 16:57:11
最强编程“大脑”:OpenAI 开放 GPT-5.2-Codex API,实战连续一周狂写 300+ 万行代码
2026-01-16 08:22:05
字节跳动最新思考模型将于4月17日供用户体验 单位推理成本相比DeepSeek R1降低50%
2025-04-14 12:33:19
字节豆包团队推出稀疏模型架构UltraMem:推理成本可降83%
2025-02-13 20:17:10
推理成本比MoE直降83%!字节最新大模型架构入围ICLR 2025
2025-02-12 12:26:20
767 文章
680022 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41