标题:大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
正文:
大神卡帕西讲解强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
西风 发自 凹非寺
量子位 | 公众号 QbitAI
AI大神Andrej Karpathy的新年第一课来了——发布三小时半视频课,解析ChatGPT等大语言模型的内部工作机制,涵盖模型训练、应用及未来趋势。
卡帕西强调,视频面向大众,即使没有技术背景也能看懂。
他在视频中用具体示例如GPT-2、Llama 3.1等,详细讲述大模型原理。DeepSeek成为一大重点。
刚发布就被网友围观,评价极高。
重点一览
卡帕西解答了关于ChatGPT等工具的疑问,详细讲解了模型构建、预训练、监督微调、强化学习等阶段。
预训练
预训练阶段涉及下载和处理互联网数据、文本提取、语言过滤、去重、tokenization等步骤。模型通过大量互联网文档数据学习生成文本的能力。
后训练
模型通过学习对话数据进行微调和强化学习,使其能生成符合人类期望的回答。卡帕西讨论了强化学习在大语言模型中的应用及其重要性,特别是DeepSeek的最新进展。
他还介绍了人类反馈的强化学习(RLHF)工作原理及其优缺点。
最后,卡帕西提到多模态模型的发展,模型能够将音频、图像和文本转化为tokens,并在同一个模型中处理。
持续专注于教育的AI大牛
卡帕西曾任特斯拉AI主管,后加入OpenAI,去年2月离职。他创办了AI原生的新型学校Eureka Labs,致力于打造“教师+人工智能的共生”。
视频链接:https://www.youtube.com/watch?v=7kVfqmGtDL8
参考链接:https://x.com/karpathy/status/1887211193099825254
Eureka Labs:
eurekalabs.ai
github.com/EurekaLabsAI
原文链接
本文链接:https://kx.umi6.com/article/12713.html
转载请注明文章出处
相关推荐
换一换
清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊丨ILCR 2026
2026-02-24 14:48:42
Kimi春节档挣超一年钱!这口“龙虾肉”大厂开始抢吃了
2026-02-26 01:05:27
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
月之暗面近20天收入超去年全年
2026-02-23 19:11:04
马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
2025-11-18 15:24:50
持续霸榜!阿里千问3.6Plus问鼎全球大模型调用周榜冠军
2026-04-07 12:52:26
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
我国大模型密集落地 新技术加速普惠应用
2026-02-14 12:17:30
卡帕西Anthropic最新头衔:技术员工(MTS)
2026-05-26 16:35:48
于骞出席德国慕尼黑汽车论坛:世界模型+强化学习是通向物理AI的必经之路
2026-03-19 19:23:06
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
腾讯宣布升级大模型研发架构 前OpenAI研究员姚顺雨任要职
2025-12-17 17:58:49
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
707 文章
628622 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41