3月20日,Predibase发布全球首个端到端强化微调平台(RFT),支持无服务器和端到端训练方法。该平台受DeepSeek-R1开源项目的启发,无需大量标注数据,通过奖励和自定义函数实现强化学习。用户仅需浏览器即可完成数据上传、目标设定及复杂的大模型微调流程。Predibase利用RFT微调的Predibase-T2T-32B-RFT模型,在Kernelbench数据集上的正确率较DeepSeek-R1、OpenAI的o1及Claude 3.7 Sonnet高出3至4倍,且模型规模更小。此外,Predibase开源了该模型,并提供在线体验地址。
原文链接
本文链接:https://kx.umi6.com/article/15782.html
转载请注明文章出处
相关推荐
换一换
感谢 DeepSeek:Predibase 发布全球首个端到端强化微调平台并开源,支持无服务器和端到端训练方法
2025-03-20 07:13:15
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
无锡高新区发布“养龙虾”12条 最高补贴500万
2026-03-09 14:47:52
鹅厂门口免费装龙虾,几百人排爆了!一代人有一代人的鸡蛋要领
2026-03-08 18:25:43
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
阿里AI办事发展速度快于亚马逊及OpenAI
2026-03-07 16:46:47
首个物理AI数据基座平台“无垠”落户浙江,专治机器人数据荒,家庭工业商业场景全覆盖
2026-03-09 19:00:56
腾讯版“小龙虾”WorkBuddy正式上线
2026-03-09 15:52:31
全网刷屏的“龙虾” 真的劝你不要盲目跟风!
2026-03-09 15:51:25
“办事”成全球AI新焦点:谷歌OpenAI相继投入 千问再加码
2026-03-06 18:25:27
苏州人工智能专项母基金等成立投资合伙企业 出资额5亿
2026-03-06 17:22:54
英伟达投资的数据中心公司Nscale完成20亿美元融资 估值达146亿美元
2026-03-09 18:02:36
青岛:设立首批16个人工智能OPC专业园区
2026-03-10 08:57:52
650 文章
453078 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22