课代表笔记:吴恩达与李沐的AI见解
李沐演讲:模型、产品部分
- 开场科普:李沐将模型训练比作“炼丹”,分为三大要素:数据、算力和算法。数据是基础,算力是工具,算法是方法。当前语言模型的目标是创造多功能、解决多种问题的“灵魂”模型。
- 硬件趋势:新型GPU系统,如英伟达的GB200,能在一个机架位容纳高达72张算力卡,提升空间利用率。水冷技术应对高密度GPU带来的散热问题,但也增加了漏水风险和基建要求。GPU紧密排列提高了通讯效率,但与CPU的PCIe通讯相对较慢。
- 内存与算力趋势:大规模语言模型对内存需求巨大,当前技术可达192GB/GPU,未来可能受限于芯片面积。算力长期将变便宜,尤其是在解决带宽和内存问题后。英伟达在市场领先,但内存方面落后于AMD和Google的TPU。
- 多模态模型:整合文本、图片、视频和声音等信息,通过文本指令控制其他模态输出。语言模型参数主流在100B到500B之间,每次预训练使用10T到50T的token。
- 产品及交互:ChatGPT改变了用户习惯,未来可能延伸至长语音交互。AI应用的本质是辅助人类完成任务,但AI离真正变革世界还有距离。
李沐演讲:创业、学习部分
- 三个方向:读博、创业、打工。创业被比喻为“当海盗”,充满刺激和不确定性,要求快速学习、适应市场并承担风险。创业提供直接面对社会的机会,但压力大,影响生活质量。
- 选择逻辑:基于强烈内在动机,包括对名、利、权的追求。将这些动力转化为积极动机,确保符合个人价值观。选择路径取决于问题的学术价值、商业价值或成长价值。
- 自我提升:从导师或上级角度总结工作,分析未达成目标的原因,采取措施解决。
吴恩达访谈:AI前景与技术
- AI前景:吴恩达对AI发展持乐观态度,生成式AI和大型语言模型具有巨大潜力。硬件供应和推理能力瓶颈将在1-2年内解决,AI技术投资回报率吸引资金流入。
- 技术重点:Agentic Workflow、模型架构、推理速度和基础设施。AI Agent能自主回顾和修复错误,提高系统稳定性。Transformer模型表现良好,提高快速推理和生成控制能力更为关键。
- 行业竞争:LLM技术成本优势,仅依赖基础模型难以建立长期竞争壁垒。公司需通过其他技术组件增强竞争力。研究公开性对长期影响有限,开源技术如Meta的Llama 3展示创新潜力。
- 企业变革:生成式AI显著提高知识型工作效率。企业变革速度缓慢,但技术推动企业重新思考工作流程的潜力巨大,加速组织适应性。
以上是对原内容的精简与整理,保留了关键信息,旨在提供清晰、简洁的概览。
原文链接
本文链接:https://kx.umi6.com/article/5606.html
转载请注明文章出处
相关推荐
.png)
换一换
吴恩达开源大模型套件:11个模型平台一种方式调用,不到半天获1.2k星
2024-11-26 21:38:44
又有 AI 创始人卖身大厂:吴恩达第一位博士生加入亚马逊,带走 25% 员工
2024-09-02 13:56:08
考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
2024-08-26 11:12:33
467 文章
83446 浏览
24小时热文
更多

-
2025-07-21 12:18:20
-
2025-07-21 12:17:10
-
2025-07-21 11:21:54