课代表笔记:吴恩达与李沐的AI见解
李沐演讲:模型、产品部分
- 开场科普:李沐将模型训练比作“炼丹”,分为三大要素:数据、算力和算法。数据是基础,算力是工具,算法是方法。当前语言模型的目标是创造多功能、解决多种问题的“灵魂”模型。
- 硬件趋势:新型GPU系统,如英伟达的GB200,能在一个机架位容纳高达72张算力卡,提升空间利用率。水冷技术应对高密度GPU带来的散热问题,但也增加了漏水风险和基建要求。GPU紧密排列提高了通讯效率,但与CPU的PCIe通讯相对较慢。
- 内存与算力趋势:大规模语言模型对内存需求巨大,当前技术可达192GB/GPU,未来可能受限于芯片面积。算力长期将变便宜,尤其是在解决带宽和内存问题后。英伟达在市场领先,但内存方面落后于AMD和Google的TPU。
- 多模态模型:整合文本、图片、视频和声音等信息,通过文本指令控制其他模态输出。语言模型参数主流在100B到500B之间,每次预训练使用10T到50T的token。
- 产品及交互:ChatGPT改变了用户习惯,未来可能延伸至长语音交互。AI应用的本质是辅助人类完成任务,但AI离真正变革世界还有距离。
李沐演讲:创业、学习部分
- 三个方向:读博、创业、打工。创业被比喻为“当海盗”,充满刺激和不确定性,要求快速学习、适应市场并承担风险。创业提供直接面对社会的机会,但压力大,影响生活质量。
- 选择逻辑:基于强烈内在动机,包括对名、利、权的追求。将这些动力转化为积极动机,确保符合个人价值观。选择路径取决于问题的学术价值、商业价值或成长价值。
- 自我提升:从导师或上级角度总结工作,分析未达成目标的原因,采取措施解决。
吴恩达访谈:AI前景与技术
- AI前景:吴恩达对AI发展持乐观态度,生成式AI和大型语言模型具有巨大潜力。硬件供应和推理能力瓶颈将在1-2年内解决,AI技术投资回报率吸引资金流入。
- 技术重点:Agentic Workflow、模型架构、推理速度和基础设施。AI Agent能自主回顾和修复错误,提高系统稳定性。Transformer模型表现良好,提高快速推理和生成控制能力更为关键。
- 行业竞争:LLM技术成本优势,仅依赖基础模型难以建立长期竞争壁垒。公司需通过其他技术组件增强竞争力。研究公开性对长期影响有限,开源技术如Meta的Llama 3展示创新潜力。
- 企业变革:生成式AI显著提高知识型工作效率。企业变革速度缓慢,但技术推动企业重新思考工作流程的潜力巨大,加速组织适应性。
以上是对原内容的精简与整理,保留了关键信息,旨在提供清晰、简洁的概览。
原文链接
本文链接:https://kx.umi6.com/article/5606.html
转载请注明文章出处
相关推荐
.png)
换一换
又有 AI 创始人卖身大厂:吴恩达第一位博士生加入亚马逊,带走 25% 员工
2024-09-02 13:56:08
考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
2024-08-26 11:12:33
吴恩达:如何在人工智能领域打造你的职业生涯?
2025-05-22 19:36:30
吴恩达最新来信:是时候关注并行智能体了
2025-08-30 17:54:14
吴恩达开源大模型套件:11个模型平台一种方式调用,不到半天获1.2k星
2024-11-26 21:38:44
一句“吴恩达说的”,就能让GPT-4o mini言听计从
2025-09-01 17:20:14
失联大神李沐B站复更:领读Llama 3.1论文;竞技场Llama 3.1排第三
2024-07-31 16:28:38
李沐老师回归B站,带着大模型创业成果填坑来了
2024-06-06 17:45:06
李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
2024-08-24 14:27:19
吴恩达AI基金成立亚洲营运中心
2024-10-30 15:18:00
课代表笔记:吴恩达和李沐对AI的见解
2024-08-29 16:37:39
吴恩达开源大模型套件:11 个模型平台一种方式调用,已获星标超 1.2K
2024-11-26 13:30:47
吴恩达推出免费课程,带你玩转 OpenAI 推理模型 o1
2024-12-21 14:57:27
518 文章
183102 浏览
24小时热文
更多

-
2025-09-05 10:23:48
-
2025-09-05 10:22:40
-
2025-09-05 10:21:32