
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
6月4日消息,快手Kwaipilot团队开源了名为KwaiCoder-AutoThink-preview的大模型,该模型融合了“思考”与“非思考”能力,号称“DeepSeek-V3 & R1合体”,能根据问题难度自动调整思考深度。团队研发了一种新训练范式,并提出Step-SRPO方法优化复杂任务表现。实测显示,在部分代码和数学任务中,启用自动思考模式后模型得分提升约20分;即便未启用,性能也有小幅提升。此模型已在多个榜单验证其优势。官方计划持续改进推理能力并开源完整技术细节。模型现已开放下载:
原文链接
加载更多

暂无内容