
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月14日消息,字节跳动最新思考模型Seed-Thinking-v1.5的技术细节今日公开,并将于4月17日通过火山引擎开放接口供用户体验。该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现出色,总参数200B,激活参数20B,单位推理成本较DeepSeek R1降低50%。专业领域表现上,数学推理得分为86.7,编程竞赛pass@8达55.0%,科学推理得分77.3%,均接近或达到业界领先水平。通用任务中,其人类评估表现优于DeepSeek R1 8%。模型采用双轨奖励机制,融合监督精调与强化学习优化,并基于HybridFlow编程模型和三层并行架构提升训练效率。
原文链接
字节跳动宣布,其最新思考模型Seed-Thinking-v1.5计划于4月17日通过火山引擎开放接口供用户测试体验。目前,该模型的技术报告已公开。Seed-Thinking-v1.5在数学、编程、科学推理等专业领域以及创意写作等通用任务中表现出色。该模型采用了MoE架构,总参数量达200B,但激活参数仅为20B,展现出显著的推理成本优势。据称,其单位推理成本较DeepSeek R1降低了50%,这标志着其在效率和经济性上的双重提升。
原文链接
字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
字节最新推出的深度思考模型Seed-Thinking-v1.5,在数学、代码等多项推理任务中超越了DeepSeek-R1,且参数规模更小。Seed-Thinking-v1.5拥有200B总参数和20B激活参数,而Deep...
原文链接
加载更多

暂无内容