标题:大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
正文:
大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
西风 发自 凹非寺
量子位 | 公众号 QbitAI
AI大神Andrej Karpathy的新年第一课来了——发布三小时半视频课,解析ChatGPT等大语言模型的内部工作机制,涵盖模型训练、应用及未来趋势。
卡帕西强调,视频面向大众,即使没有技术背景也能看懂。
他在视频中用具体示例如GPT-2、Llama 3.1等,详细讲述大模型原理。DeepSeek成为一大重点。
刚发布就被网友围观,评价极高。
重点一览
卡帕西解答了关于ChatGPT等工具的疑问,详细讲解了模型构建、预训练、监督微调、强化学习等阶段。
预训练
预训练阶段涉及下载和处理互联网数据、文本提取、语言过滤、去重、tokenization等步骤。模型通过大量互联网文档数据学习生成文本的能力。
后训练
模型通过学习对话数据进行微调和强化学习,使其能生成符合人类期望的回答。卡帕西讨论了强化学习在大语言模型中的应用及其重要性,特别是DeepSeek的最新进展。
他还介绍了人类反馈的强化学习(RLHF)工作原理及其优缺点。
最后,卡帕西提到多模态模型的发展,模型能够将音频、图像和文本转化为tokens,并在同一个模型中处理。
持续专注于教育的AI大牛
卡帕西曾任特斯拉AI主管,后加入OpenAI,去年2月离职。他创办了AI原生的新型学校Eureka Labs,致力于打造“教师+人工智能的共生”。
视频链接:https://www.youtube.com/watch?v=7kVfqmGtDL8
参考链接:https://x.com/karpathy/status/1887211193099825254
Eureka Labs:
eurekalabs.ai
github.com/EurekaLabsAI
原文链接
本文链接:https://kx.umi6.com/article/12713.html
转载请注明文章出处
相关推荐
换一换
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025-09-18 13:54:10
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
我国大模型数量超1500个
2025-07-27 23:04:18
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
DeepSeek V3.2、GLM4.6等大模型即将发布
2025-09-29 17:14:30
智谱旗舰模型GLM-4.5重磅发布 相关企业有望站上风口
2025-07-29 08:27:00
大模型“记性差一点”反而更聪明!金鱼损失随机剔除token,让AI不再死记硬背
2025-09-03 17:49:26
智谱与市城投集团合作发布杭州城投人工智能产业大模型项目(一期)建设成果
2025-09-15 20:01:43
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
小米最新大模型成果!罗福莉现身了
2025-10-17 16:21:28
你用的大模型是什么MBTI?
2025-09-23 20:23:14
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
516 文章
240614 浏览
24小时热文
更多
-
2025-10-25 08:14:19 -
2025-10-24 22:57:14 -
2025-10-24 21:54:02