3月20日,Predibase发布全球首个端到端强化微调平台(RFT),支持无服务器和端到端训练方法。该平台受DeepSeek-R1开源项目的启发,无需大量标注数据,通过奖励和自定义函数实现强化学习。用户仅需浏览器即可完成数据上传、目标设定及复杂的大模型微调流程。Predibase利用RFT微调的Predibase-T2T-32B-RFT模型,在Kernelbench数据集上的正确率较DeepSeek-R1、OpenAI的o1及Claude 3.7 Sonnet高出3至4倍,且模型规模更小。此外,Predibase开源了该模型,并提供在线体验地址。
原文链接
本文链接:https://kx.umi6.com/article/15782.html
转载请注明文章出处
相关推荐
.png)
换一换
原价 20 美元 Pro 会员喜加 1 个月:Perplexity AI 上线大学生教育优惠计划
2025-07-18 22:45:59
被曝裁员、清空社交账号后,Manus 首度发布技术博客总结经验教训
2025-07-19 16:54:40
Netflix 承认已在自制剧集中使用生成式 AI:制作比传统特效快 10 倍
2025-07-18 23:46:25
426 文章
65983 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13