标题:大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
正文:
大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
西风 发自 凹非寺
量子位 | 公众号 QbitAI
AI大神Andrej Karpathy的新年第一课来了——发布三小时半视频课,解析ChatGPT等大语言模型的内部工作机制,涵盖模型训练、应用及未来趋势。
卡帕西强调,视频面向大众,即使没有技术背景也能看懂。
他在视频中用具体示例如GPT-2、Llama 3.1等,详细讲述大模型原理。DeepSeek成为一大重点。
刚发布就被网友围观,评价极高。
重点一览
卡帕西解答了关于ChatGPT等工具的疑问,详细讲解了模型构建、预训练、监督微调、强化学习等阶段。
预训练
预训练阶段涉及下载和处理互联网数据、文本提取、语言过滤、去重、tokenization等步骤。模型通过大量互联网文档数据学习生成文本的能力。
后训练
模型通过学习对话数据进行微调和强化学习,使其能生成符合人类期望的回答。卡帕西讨论了强化学习在大语言模型中的应用及其重要性,特别是DeepSeek的最新进展。
他还介绍了人类反馈的强化学习(RLHF)工作原理及其优缺点。
最后,卡帕西提到多模态模型的发展,模型能够将音频、图像和文本转化为tokens,并在同一个模型中处理。
持续专注于教育的AI大牛
卡帕西曾任特斯拉AI主管,后加入OpenAI,去年2月离职。他创办了AI原生的新型学校Eureka Labs,致力于打造“教师+人工智能的共生”。
视频链接:https://www.youtube.com/watch?v=7kVfqmGtDL8
参考链接:https://x.com/karpathy/status/1887211193099825254
Eureka Labs:
eurekalabs.ai
github.com/EurekaLabsAI
原文链接
本文链接:https://kx.umi6.com/article/12713.html
转载请注明文章出处
相关推荐
换一换
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
花3000元让AI改口,大模型的尽头是广告?
2026-01-06 19:29:29
豆包大模型2.0正式发布
2026-02-14 14:23:01
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
亚马逊云科技发布多款大模型
2025-12-03 14:25:54
阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队
2026-02-27 15:48:37
不整虚的!中美AI同步加速:47天30次更新,中国AI的最强主场究竟在哪?
2026-02-22 18:50:22
2025最大赌注:为什么所有厂商都押宝AI手机?
2025-12-25 09:25:38
李开复任命三位新高管:零一万物的“一把手工程”与大模型中场战事
2025-10-27 13:00:52
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
8块钱跑通一次强化学习全流程,潞晨云重塑微调赛道:1名算法工程师=1支Infra团队
2026-01-07 16:15:48
649 文章
458722 浏览
24小时热文
更多
-
2026-03-10 11:10:02 -
2026-03-10 11:09:29 -
2026-03-10 11:08:54