标题:OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
正文: OpenAI“双12”直播第二天,主题为新功能“强化微调”,使用极少训练数据即可创建专家模型。最低只需几十个例子。
CEO奥特曼称其效果极佳,是他2024年的最大惊喜。“微调后的o1-mini模型得分提高了80%,直接反超o1正式版。”
OpenAI已启动强化微调研究计划,开发者可申请访问强化微调API的alpha版本。测试时,使用几十到几千个高质量数据,模型能通过强化学习自行探索和学习复杂任务。
OpenAI员工Jerry Tworek表示,“AGI不是授人以鱼,而是授人以渔”。
直播演示了一个生物医学任务,AI需根据病例描述找出相关基因。评分模型对模型答案进行评分,OpenAI提供不同评分模型并支持自定义。
强化微调步骤简单,在网页界面选择训练集和验证集,配置超参数即可。微调过程中,可观察模型性能指标变化。测试完成后,可查看模型对每条验证数据的输出。
目前,强化微调已在生物化学、安全、法律和医疗保健领域取得成功。该功能将在2025年初作为产品发布,企业、大学和研究院已开放申请测试通道。
有人总结,强化微调可能不适合所有任务,但在科学领域将带来突破性成果。直播第二天略显平淡,但奥特曼未否认发布Sora的消息。
OpenAI #强化微调 #AI创新
原文链接
本文链接:https://kx.umi6.com/article/9835.html
转载请注明文章出处
相关推荐
换一换
OpenAI据悉正在开发一款对标苹果AirPods的人工智能设备
2026-01-14 15:44:46
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
免费用:OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员
2025-12-17 08:27:39
OpenAI 亲自“打预防针”,警告自家新模型存在“高级别”网络安全风险
2025-12-11 16:01:13
OpenAI:将自行承担“星际之门”项目能源费用,确保不会推高电价
2026-01-21 13:12:22
OpenAI首款硬件定型为笔!网友:就叫oPen吧
2026-01-04 16:12:59
OpenAI高薪招聘“应急主管”:AI安全治理压力持续上升
2025-12-30 00:50:46
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
奥尔特曼:OpenAI GPT-5.2 API 上线首日 tokens 超万亿,且增长迅速
2025-12-13 15:55:03
OpenAI最新报告曝光!前5%精英效率暴涨16倍,普通人却被悄悄淘汰
2025-12-10 14:51:01
OpenAI和NextDC计划斥资46亿美元在澳大利亚悉尼建设数据中心
2025-12-05 11:28:34
GPT-5.2提前泄露?今夜,OpenAI要拿Gemini 3祭天!
2025-12-12 15:54:18
OpenAI合作项目驱动对AI领军企业多年期业绩预期的上调
2025-12-15 21:00:57
666 文章
432916 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34