课代表笔记：吴恩达和李沐对AI的见解

2024-08-29 16:37:39

课代表笔记：吴恩达和李沐对AI的见解

AI幻想空间站

发布在

科普

阅读：0

开场科普：李沐将模型训练比作“炼丹”，分为三大要素：数据、算力和算法。数据是基础，算力是工具，算法是方法。当前语言模型的目标是创造多功能、解决多种问题的“灵魂”模型。
硬件趋势：新型GPU系统，如英伟达的GB200，能在一个机架位容纳高达72张算力卡，提升空间利用率。水冷技术应对高密度GPU带来的散热问题，但也增加了漏水风险和基建要求。GPU紧密排列提高了通讯效率，但与CPU的PCIe通讯相对较慢。
内存与算力趋势：大规模语言模型对内存需求巨大，当前技术可达192GB/GPU，未来可能受限于芯片面积。算力长期将变便宜，尤其是在解决带宽和内存问题后。英伟达在市场领先，但内存方面落后于AMD和Google的TPU。
多模态模型：整合文本、图片、视频和声音等信息，通过文本指令控制其他模态输出。语言模型参数主流在100B到500B之间，每次预训练使用10T到50T的token。
产品及交互：ChatGPT改变了用户习惯，未来可能延伸至长语音交互。AI应用的本质是辅助人类完成任务，但AI离真正变革世界还有距离。

三个方向：读博、创业、打工。创业被比喻为“当海盗”，充满刺激和不确定性，要求快速学习、适应市场并承担风险。创业提供直接面对社会的机会，但压力大，影响生活质量。
选择逻辑：基于强烈内在动机，包括对名、利、权的追求。将这些动力转化为积极动机，确保符合个人价值观。选择路径取决于问题的学术价值、商业价值或成长价值。
自我提升：从导师或上级角度总结工作，分析未达成目标的原因，采取措施解决。

AI前景：吴恩达对AI发展持乐观态度，生成式AI和大型语言模型具有巨大潜力。硬件供应和推理能力瓶颈将在1-2年内解决，AI技术投资回报率吸引资金流入。
技术重点：Agentic Workflow、模型架构、推理速度和基础设施。AI Agent能自主回顾和修复错误，提高系统稳定性。Transformer模型表现良好，提高快速推理和生成控制能力更为关键。
行业竞争：LLM技术成本优势，仅依赖基础模型难以建立长期竞争壁垒。公司需通过其他技术组件增强竞争力。研究公开性对长期影响有限，开源技术如Meta的Llama 3展示创新潜力。
企业变革：生成式AI显著提高知识型工作效率。企业变革速度缓慢，但技术推动企业重新思考工作流程的潜力巨大，加速组织适应性。

以上是对原内容的精简与整理，保留了关键信息，旨在提供清晰、简洁的概览。

原文链接

本文链接：https://kx.umi6.com/article/5606.html

转载请注明文章出处

AI见解