标题:OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
正文: OpenAI“双12”直播第二天,主题为新功能“强化微调”,使用极少训练数据即可创建专家模型。最低只需几十个例子。
CEO奥特曼称其效果极佳,是他2024年的最大惊喜。“微调后的o1-mini模型得分提高了80%,直接反超o1正式版。”
OpenAI已启动强化微调研究计划,开发者可申请访问强化微调API的alpha版本。测试时,使用几十到几千个高质量数据,模型能通过强化学习自行探索和学习复杂任务。
OpenAI员工Jerry Tworek表示,“AGI不是授人以鱼,而是授人以渔”。
直播演示了一个生物医学任务,AI需根据病例描述找出相关基因。评分模型对模型答案进行评分,OpenAI提供不同评分模型并支持自定义。
强化微调步骤简单,在网页界面选择训练集和验证集,配置超参数即可。微调过程中,可观察模型性能指标变化。测试完成后,可查看模型对每条验证数据的输出。
目前,强化微调已在生物化学、安全、法律和医疗保健领域取得成功。该功能将在2025年初作为产品发布,企业、大学和研究院已开放申请测试通道。
有人总结,强化微调可能不适合所有任务,但在科学领域将带来突破性成果。直播第二天略显平淡,但奥特曼未否认发布Sora的消息。
OpenAI #强化微调 #AI创新
原文链接
本文链接:https://kx.umi6.com/article/9835.html
转载请注明文章出处
相关推荐
换一换
OpenAI发布20颗HBM内存堆栈的芯片专利
2026-04-23 17:19:48
AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI
2026-05-07 23:46:12
OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
2026-04-14 17:09:22
OpenAI首席财务官:公司或将筹集更多资金 未来可能考虑通过公开市场融资
2026-05-15 16:58:46
OpenAI挖走中科大少年班校友!12岁上大学,哈佛史上最年轻正教授
2026-06-02 23:51:42
马斯克诉OpenAI案新进展:微软CEO纳德拉称马斯克从未向其质疑微软投资
2026-05-12 12:09:18
给「对手」的钱比给「盟友」多,亚马逊疯了吗?
2026-04-30 12:20:19
OpenAI向部分用户发布Cyber模型 与Mythos展开竞争
2026-04-15 05:40:45
OpenAI与美国军方合作引发用户反对:ChatGPT卸载量增加295% 一星评价激增775%
2026-03-03 11:59:16
1220亿美元!OpenAI创下史上最大单笔融资纪录
2026-04-01 09:34:49
欧盟委员会对OpenAI开放新型ChatGPT模型访问权限表示欢迎
2026-05-11 20:28:29
OpenAI关停Sora 奥尔特曼坦言:为了下一代AI 集中计算资源
2026-04-07 20:16:56
OpenAI芯片核心叛逃Anthropic!就在量产前夜
2026-06-07 20:48:02
738 文章
640439 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08