1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

字节Seed首次开源代码模型Seed-Coder,8B规模,超越Qwen3,拿下多个SOTA。该模型证明“只需极少人工参与,LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据,大幅提升代码生成能力。

Seed-Coder包含Base、Instruct、Reasoning三个版本,其中Instruct在编程方面表现优异,推理版本在IOI 2024上超越QwQ-32B和DeepSeek-R1。模型上下文长度32K,使用6T tokens训练,并采用宽松的MIT开源协议,代码已发布在Hugging Face。

Seed-Coder的前身是doubao-coder,采用Llama 3结构,参数量8.2B。团队提出“模型中心”数据处理方式,使用模型策划数据,从GitHub和网络档案中提取高质量代码数据,分为文件级、仓库级、Commit数据及代码相关网络数据四类。通过SHA256哈希和MinHash算法去重,结合Tree-sitter语法解析器和评分模型,最终构建了约1万亿个独特token的语料库。

Seed-Coder的预训练分两阶段:常规预训练和持续预训练。此外,团队开发了指令模型(-Instruct)和推理模型(-Reasoning)两个变体。字节Seed近期还开源了视频生成模型Seaweed、推理模型Seed-Thinking-v1.5及智能体UI-TARS,推动AI普惠和技术开放。

原文链接
本文链接:https://kx.umi6.com/article/18425.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型自指:代码生成的递归式自我提升
2025-09-02 20:37:56
群核科技升级空间智能战略,发布两款空间开源模型
2025-08-25 17:31:32
字节跳动开源长文本处理模型Seed-OSS-36B
2025-08-21 14:39:00
从 OpenClaw 们自掏腰包补贴,看中国模型又一个全球时刻
2026-02-03 02:12:36
开源模型三城记
2025-07-30 10:43:17
具身开源模型新王!千寻Spirit v1.5模型登顶 RoboChallenge,终结 Pi0.5领跑时代
2026-01-12 16:41:44
Ubuntu 团队测试 AI 生成代码:总体表现尚可,但一小部分函数“完全错误”
2025-12-07 20:45:46
微博自研VibeThinker开源模型:训练成本仅7800美元
2025-11-18 15:27:09
GLM-5真够顶的:超24小时自己跑代码,700次工具调用、800次切上下文!
2026-02-14 16:26:42
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
24小时热文
更多
扫一扫体验小程序