1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

字节Seed首次开源代码模型Seed-Coder,8B规模,超越Qwen3,拿下多个SOTA。该模型证明“只需极少人工参与,LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据,大幅提升代码生成能力。

Seed-Coder包含Base、Instruct、Reasoning三个版本,其中Instruct在编程方面表现优异,推理版本在IOI 2024上超越QwQ-32B和DeepSeek-R1。模型上下文长度32K,使用6T tokens训练,并采用宽松的MIT开源协议,代码已发布在Hugging Face。

Seed-Coder的前身是doubao-coder,采用Llama 3结构,参数量8.2B。团队提出“模型中心”数据处理方式,使用模型策划数据,从GitHub和网络档案中提取高质量代码数据,分为文件级、仓库级、Commit数据及代码相关网络数据四类。通过SHA256哈希和MinHash算法去重,结合Tree-sitter语法解析器和评分模型,最终构建了约1万亿个独特token的语料库。

Seed-Coder的预训练分两阶段:常规预训练和持续预训练。此外,团队开发了指令模型(-Instruct)和推理模型(-Reasoning)两个变体。字节Seed近期还开源了视频生成模型Seaweed、推理模型Seed-Thinking-v1.5及智能体UI-TARS,推动AI普惠和技术开放。

原文链接
本文链接:https://kx.umi6.com/article/18425.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 揭秘如何用 28 天开发安卓版 Sora:85% 代码由 Codex 生成,仅由 4 名工程师协作
2025-12-13 09:40:44
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!
2025-11-26 17:55:27
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升
2025-08-13 08:31:33
一周六连发!昆仑万维将多模态AI卷到了新高度
2025-08-17 18:38:51
腾讯混元 0.5B、1.8B、4B、7B 模型开源发布,消费级显卡即可运行
2025-08-04 15:58:47
OpenAI 推出两款开源模型 gpt-oss-120b / 20b,性能逼近 o4-mini/o3-mini
2025-08-06 08:23:05
OpenAI进入新品发布周期 开源模型GPT-OSS打头阵
2025-08-06 08:26:35
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索
2025-11-18 12:13:36
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
24小时热文
更多
扫一扫体验小程序