2026年1月,北京版幻方量化公司九坤投资开源了SOTA代码大模型IQuest-Coder-V1系列,引发国内外科技圈热议。该模型40B参数版本在SWE-Bench Verified榜单中取得81.4%的成绩,超越Claude Opus-4.5和GPT-5.2。模型支持多种参数规模(7B、14B、40B),并提供Instruct和Thinking两种版本,适用于代码生成与软件工程任务。其创新架构包括分组查询注意力(GQA)、128K上下文长度支持及循环Transformer设计,显著提升推理效率与性能。训练策略采用“代码流多阶段训练”,通过项目生命周期数据优化动态代码理解能力。IQuest-Coder可在单张消费级3090/4090 GPU上运行,部署门槛低。背后团队核心成员来自清华、北大等顶尖高校,部分曾参与Qwen系列研发。九坤投资以量化私募起家,近年大力布局AI领域,此前已推出通用推理模型URM。
原文链接
本文链接:https://kx.umi6.com/article/31056.html
转载请注明文章出处
相关推荐
换一换
大模型自指:代码生成的递归式自我提升
2025-09-02 20:37:56
最强编程“大脑”:OpenAI 开放 GPT-5.2-Codex API,实战连续一周狂写 300+ 万行代码
2026-01-16 08:22:05
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升
2025-08-13 08:31:33
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
168 小时 AI 狂写 300 万行代码造出浏览器!Cursor 公开数百个智能体自主协作方案
2026-01-18 12:16:45
LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典
2025-09-25 10:58:45
GitHub Copilot 推出视觉功能:图片可秒变代码
2025-02-08 10:20:04
OpenAI 最强智能体编程模型 GPT-5.2-Codex 登场:AI 写代码新巅峰,优化 Win11 原生环境
2025-12-19 07:32:42
自主操作电脑的多模态 Agent 升级,智谱 GLM-PC 开放体验
2025-01-23 15:23:22
将偏好学习引入模型训练,北大李戈团队新框架,可显著提升代码准确性与执行效率
2024-11-28 00:08:18
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
2025-05-11 13:19:07
又一开源AI神器!将机器学习论文自动转为可运行代码库
2025-05-01 12:21:11
793 文章
609473 浏览
24小时热文
更多
-
2026-04-24 15:20:44 -
2026-04-24 15:19:39 -
2026-04-24 15:18:33