2025年8月21日,字节跳动Seed团队正式开源360亿参数的大模型Seed-OSS-36B,支持512K超长上下文窗口,为主流长度的4倍。该模型采用Apache-2.0协议,可免费用于学术和商业用途,并引入“思考预算”机制以灵活控制推理深度。在多项基准测试中表现优异,如MMLU-Pro得分65.1、GSM8K数学能力达90.8分,刷新开源模型记录。此外,团队还提供包含或不包含合成指令数据的两个版本基座模型,为研究提供更多选择。字节Seed团队自2023年成立以来已发布多个细分领域项目,此次开源进一步丰富了国产Base模型生态。详情见GitHub与HuggingFace页面。
原文链接
本文链接:https://kx.umi6.com/article/23928.html
转载请注明文章出处
相关推荐
.png)
换一换
字节跳动发布端到端同声传译模型
2025-07-24 13:08:06
DeepSeek终于把OpenAI逼急了
2025-08-06 16:35:39
拿下38项第一!字节发布Seed1.5-VL多模态推理模型
2025-05-14 15:15:44
前谷歌CEO:千万不要低估中国的AI竞争力
2025-05-10 12:07:51
OpenAI再次推迟发布开源模型
2025-07-14 08:16:03
Altman对话YC总裁:OpenAI的开源模型将远超期待
2025-06-23 10:30:02
消息称字节跳动内部将禁用第三方 AI 开发软件,用自家 Trae 替代
2025-05-28 17:01:31
字节跳动Seed团队与比亚迪锂电池将共建AI+高通量联合实验室
2025-06-18 12:37:11
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
字节跳动发布图像编辑模型SeedEdit 3.0
2025-06-06 16:38:41
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
开源全能图像模型媲美GPT-4o!解决扩散模型误差累计问题
2025-05-12 16:35:41
457 文章
96267 浏览
24小时热文
更多

-
2025-08-23 03:55:57
-
2025-08-23 02:55:42
-
2025-08-22 23:54:20