1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜

正文: OpenAI“双12”直播第二天,主题为新功能“强化微调”,使用极少训练数据即可创建专家模型。最低只需几十个例子。

CEO奥特曼称其效果极佳,是他2024年的最大惊喜。“微调后的o1-mini模型得分提高了80%,直接反超o1正式版。”

OpenAI已启动强化微调研究计划,开发者可申请访问强化微调API的alpha版本。测试时,使用几十到几千个高质量数据,模型能通过强化学习自行探索和学习复杂任务。

OpenAI员工Jerry Tworek表示,“AGI不是授人以鱼,而是授人以渔”。

直播演示了一个生物医学任务,AI需根据病例描述找出相关基因。评分模型对模型答案进行评分,OpenAI提供不同评分模型并支持自定义。

强化微调步骤简单,在网页界面选择训练集和验证集,配置超参数即可。微调过程中,可观察模型性能指标变化。测试完成后,可查看模型对每条验证数据的输出。

目前,强化微调已在生物化学、安全、法律和医疗保健领域取得成功。该功能将在2025年初作为产品发布,企业、大学和研究院已开放申请测试通道。

有人总结,强化微调可能不适合所有任务,但在科学领域将带来突破性成果。直播第二天略显平淡,但奥特曼未否认发布Sora的消息。

OpenAI #强化微调 #AI创新

原文链接
本文链接:https://kx.umi6.com/article/9835.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软 Azure 推出业界首个生产级英伟达 GB300 NVL72 大型集群,顾客为 OpenAI
2025-10-11 10:01:36
OpenAI号称有花不完的钱!AI泡沫似曾相识 发人深思
2025-10-15 13:34:31
OpenAI也缺卡!僧多粥少,自曝内部抢卡抢到发疯
2025-10-21 13:25:09
OpenAI 加强 Sora 保护措施,严格禁止未经授权使用名人肖像和声音
2025-10-21 08:20:52
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
OpenAI“解禁”成人内容,是福是祸?
2025-10-16 14:58:22
软银为进一步投资OpenAI做准备:拟借款50亿美元充实资金储备
2025-10-11 10:34:20
OpenAI 启动 Codex Alpha 计划,将邀用户体验前沿 AI 编程模型
2025-10-06 11:35:29
OpenAI已砸1万亿美元 苏姿丰否认AI泡沫化:别太狭隘
2025-10-09 09:20:15
OpenAI收购由前苹果员工创立的人工智能初创公司
2025-10-24 01:20:07
贴脸开大,OpenAI 研究员当面嘲讽马斯克为 xAI 提出的 AGI 愿景
2025-10-22 08:41:17
OpenAI宣布推出基于ChatGPT技术构建的新型AI网页浏览器ChatGPT Atlas
2025-10-22 03:35:06
“O链”已然形成,英伟达也不过是其中一环
2025-10-11 13:29:17
24小时热文
更多
扫一扫体验小程序