标题:OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
正文: OpenAI“双12”直播第二天,主题为新功能“强化微调”,使用极少训练数据即可创建专家模型。最低只需几十个例子。
CEO奥特曼称其效果极佳,是他2024年的最大惊喜。“微调后的o1-mini模型得分提高了80%,直接反超o1正式版。”
OpenAI已启动强化微调研究计划,开发者可申请访问强化微调API的alpha版本。测试时,使用几十到几千个高质量数据,模型能通过强化学习自行探索和学习复杂任务。
OpenAI员工Jerry Tworek表示,“AGI不是授人以鱼,而是授人以渔”。
直播演示了一个生物医学任务,AI需根据病例描述找出相关基因。评分模型对模型答案进行评分,OpenAI提供不同评分模型并支持自定义。
强化微调步骤简单,在网页界面选择训练集和验证集,配置超参数即可。微调过程中,可观察模型性能指标变化。测试完成后,可查看模型对每条验证数据的输出。
目前,强化微调已在生物化学、安全、法律和医疗保健领域取得成功。该功能将在2025年初作为产品发布,企业、大学和研究院已开放申请测试通道。
有人总结,强化微调可能不适合所有任务,但在科学领域将带来突破性成果。直播第二天略显平淡,但奥特曼未否认发布Sora的消息。
OpenAI #强化微调 #AI创新
原文链接
本文链接:https://kx.umi6.com/article/9835.html
转载请注明文章出处
相关推荐
换一换
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
14亿元留不住!庞若鸣弃Meta加盟OpenAI
2026-02-26 13:58:39
OpenAI CFO称公司2025年年化收入已突破200亿美元
2026-01-20 10:01:28
OpenAI前高管坦言公司“掉链子” 让竞争对手谷歌得以翻身
2026-01-24 00:23:19
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
2026-02-06 11:46:30
OpenAI从前首席技术官Murati的AI创企挖走三名员工
2026-01-15 16:46:18
OpenAI或为亚马逊AI产品开发定制化模型
2026-02-04 22:10:24
中信建投:OpenAI落地广告变现 大模型商业化加速中
2026-02-04 08:30:40
Claude豪掷千万在美国春晚开撕OpenAI 奥特曼回击:伪君子
2026-02-05 20:09:29
OpenAI准备在本周推出更新版聊天模型
2026-02-09 21:33:55
OpenAI 新功能曝光:代号“奏鸣曲”,猜测与 ChatGPT 音频体验有关
2026-01-19 19:09:37
三个和尚没水喝!OpenAI星际之门搁浅,一年过去压根没动工
2026-02-23 15:34:57
OpenAI最新融资1100亿美元!英伟达亚马逊软银都抢到船票了
2026-02-28 12:08:27
691 文章
480354 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22