1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:豆包代码大模型曝光!在字节最新开源基准里,多种编程语言性能仅次于OpenAI/Claude

正文: 豆包代码大模型,名为Doubao-Coder,近期在字节开源的FullStack Bench基准中被曝光。该模型目前处于Preview版本,尚未正式上线。在多种编程语言上,Doubao-Coder的性能表现优异,在闭源模型中排名第五。

此外,字节还发布了AI编程助手豆包MarsCode,据说由Doubao-Coder模型支撑,每月为用户生成百万量级代码。

FullStack Bench是目前最全面的代码评估数据集,涵盖了超过11类真实编程场景和16种编程语言,包含3374个问题。这些数据来源于Stack Overflow,相比其他基准,FullStack Bench覆盖了更多编程领域,能更真实地反映AI编程能力。

研究团队通过FullStack Bench对全球20余款代码大模型及语言大模型进行了评测。结果显示,尽管开源模型在某些方面表现出色,但在解决难题时,闭源模型普遍优于开源模型,特别是在数学编程领域。此外,模型在不同编程语言上的表现也存在差异,部分开源小模型在多语言处理上较为薄弱。

为方便开发者评估大模型代码能力,字节开源了SandboxFusion,一个高效的代码沙盒执行工具,支持23种编程语言,可在单服务器上部署,也可在线体验。

详细了解评测结果和数据集,请访问相关链接。

原文链接
本文链接:https://kx.umi6.com/article/9756.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包代码大模型曝光!在字节最新开源基准里,多种编程语言性能仅次于OpenAI/Claude
2024-12-05 19:05:25
全国首批,商汤大装置SenseCore获工信部软件供应链安全能力评估优秀级认证
2026-02-13 14:24:55
又一个谷歌不作恶式的形象崩塌 OpenAI删除AI安全造福人类承诺
2026-02-14 22:47:09
上海:到2028年底 实现AI眼镜等智能终端的规模化接入
2026-02-13 08:09:20
抖音集团副总裁:春晚是第一个用上Seedance2.0的公开项目
2026-02-15 17:34:23
软件股风声鹤唳之际 高盛推出“抗AI替代”主题股票篮子
2026-02-14 02:54:44
群核科技拟在港交所上市 发行不超过3.12亿股普通股
2026-02-14 17:34:12
工信部:加大对低空产业创新发展的政策支持,加快标准预研,建立健全产业标准体系
2026-02-13 18:34:10
中信证券:AI需求引发全球核电行业全面复兴 核电制造业估值有望重估
2026-02-15 13:23:08
MiniMax M2.5发布
2026-02-13 08:07:07
研究揭示大脑“举一反三”的神经机制
2026-02-16 11:16:04
鲁棒RL赋能AI编程!破局企业数据噪声难题,同等算力训出更好模型
2026-02-16 19:35:37
OpenAI:自本周五起将关闭五款旧版ChatGPT模型的使用权限
2026-02-14 16:30:00
24小时热文
更多
扫一扫体验小程序