1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”

正文:

大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”

西风 发自 凹非寺

量子位 | 公众号 QbitAI

AI大神Andrej Karpathy的新年第一课来了——发布三小时半视频课,解析ChatGPT等大语言模型的内部工作机制,涵盖模型训练、应用及未来趋势。

卡帕西强调,视频面向大众,即使没有技术背景也能看懂。

他在视频中用具体示例如GPT-2、Llama 3.1等,详细讲述大模型原理。DeepSeek成为一大重点。

刚发布就被网友围观,评价极高。

重点一览

卡帕西解答了关于ChatGPT等工具的疑问,详细讲解了模型构建、预训练、监督微调、强化学习等阶段。

预训练

预训练阶段涉及下载和处理互联网数据、文本提取、语言过滤、去重、tokenization等步骤。模型通过大量互联网文档数据学习生成文本的能力。

后训练

模型通过学习对话数据进行微调和强化学习,使其能生成符合人类期望的回答。卡帕西讨论了强化学习在大语言模型中的应用及其重要性,特别是DeepSeek的最新进展。

他还介绍了人类反馈的强化学习(RLHF)工作原理及其优缺点。

最后,卡帕西提到多模态模型的发展,模型能够将音频、图像和文本转化为tokens,并在同一个模型中处理。

持续专注于教育的AI大牛

卡帕西曾任特斯拉AI主管,后加入OpenAI,去年2月离职。他创办了AI原生的新型学校Eureka Labs,致力于打造“教师+人工智能的共生”。

视频链接:https://www.youtube.com/watch?v=7kVfqmGtDL8

参考链接:https://x.com/karpathy/status/1887211193099825254

Eureka Labs:
eurekalabs.ai
github.com/EurekaLabsAI

原文链接
本文链接:https://kx.umi6.com/article/12713.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
三家混战,大模型重回2023
2025-08-03 11:35:50
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
任务级奖励提升App Agent思考力,淘天提出Mobile-R1,3B模型可超32B
2025-07-20 15:05:31
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
港股AGI第一股“云知声”首战告捷:大模型贡献1亿收入,单客价直线提升116.2%,AI保险业务暴涨1386.8%
2025-08-29 20:43:34
卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度
2025-08-17 12:35:45
讯飞星火 X1 升级版模型宣布上线:整体效果对标 OpenAI o3 等国内外一流大模型
2025-07-25 14:25:03
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
训练大模型烧了那么多钱,商业价值到底在哪?
2025-07-04 09:39:31
1万tokens是检验长文本的新基准,超过后18款大模型集体失智
2025-07-17 15:23:24
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
24小时热文
更多
扫一扫体验小程序