标题:硅谷2025的AI 答案:60条关键洞察
正文:今年初,我在硅谷组织了锦秋的Scale With AI活动,吸引了超过100人参与。参与者包括研究员、创业者、投资人,涵盖众多知名企业和投资机构。
AI正在重塑世界,硅谷则是这场变革的核心。然而,我感受到中国从业者的努力也在推动这一进程。
对于大型语言模型(LLM),预训练阶段接近尾声,但仍有提升空间。结构、算力和数据是关键因素,尤其是多模态方面,数据和算力更为重要。预训练投入减少,更多转向边际效益更高的后训练。
预训练不在乎数据质量,后训练则需高质量数据。预训练是模仿,后训练是创造。模型的基础能力决定了后训练的效果。
大模型优化影响产品能力,尤其在安全性方面。多智能体框架也能提高模型解决问题的能力。并非所有场景都需要大模型,小模型也可能有效。
随着预训练到达瓶颈,闭源和开源差距缩小。大模型生成数据再训练小模型是可行的,但反之则难。合成数据和真实数据的区别主要在于质量。
团队建设方面,5人足以支撑后训练。分别负责基础设施、数据管理、模型开发、产品编排和用户反馈。
数据管道构建方面,高效迭代和结构化数据仓库很重要。数据输入需高效标注和丰富用户反馈,形成护城河。初始阶段侧重SFT,后续阶段则注重RL。
视频模型的预训练仍处于早期阶段,数据集和版权问题制约发展。DiT方案还需提升物理规律的遵循。视频生成效率是瓶颈,但应用并未放缓。
面向不同场景选择技术栈是趋势。视频生成还需提高清晰度、一致性和可控性。长视频生成需提升速度和故事性。美学提升主要靠后训练。
视频理解面临长上下文和延迟问题。文字可能是通向AGI的捷径,视频与文字效率差距巨大。语音模型的端到端进步显著。多模态模型尚处早期阶段,但未来可能提升智力。
具身智能尚未迎来突破,机器人需解决物理世界任务。泛化能力是关键,但环境复杂性和物理交互带来挑战。机器人需聚焦特定任务,而非全面泛化。
斯坦福实验室聚焦家庭场景,如老龄化社会中的家务机器人。明确任务范围,通过仿真平台和数据采集实现泛化。
通用模型与特定任务模型存在冲突。未来需在通用性和专用性间找到平衡。多模态数据整合可提升机器人能力。
数据闭环难实现,仿真与真实环境差距显著。工业环境更适合机器人技术的早期部署。触觉和力觉数据提供关键反馈,但数据采集成本高。
混合模型应用通过仿真和真实数据相结合,缩小Sim-to-Real Gap。数据共享面临挑战,需建立统一机制。
硅谷VC看好2025年的AI应用投资机会。AI公司作为新物种,成长迅速。新一代中国创始人受到关注,但需在美国基地。
.png)

-
2025-07-19 11:52:20
-
2025-07-19 11:51:22
-
2025-07-19 10:50:54