清华唐杰:领域大模型,伪命题
清华教授唐杰在微博分享了关于AI的八点感悟,内容简练却富有洞见:
- 基座模型的Scaling仍高效:更多数据、更大参数和更强计算是提升基座模型的最佳路径。
- 长尾能力对齐与推理增强:真实场景中,激活长尾能力和增强推理能力至关重要,需通过mid和post training实现快速对齐。
- Agent代表生产力:Agent是模型进入真实世界的里程碑,难点在于不同环境的泛化与迁移,需增加数据和强化学习。
- 记忆机制不可或缺:模型需要具备短期、中期和长期记忆,context、RAG等技术可能对应人类记忆的不同阶段,但迭代知识仍是难题。
- 在线学习与自我评估:模型需具备在线学习能力,自我评估是关键,这可能是下一阶段的scaling范式。
- 研发与应用结合:AI的本质是替代人类工作,而非创造新应用,未来将是AI替代不同工种的爆发期。
- 多模态与具身智能:多模态有前景但难以突破AGI上限,具身智能受限于机器人硬件问题,但数据规模提升将推动进展。
- 领域大模型是伪命题:AGI时代无需domain-specific模型,领域模型的存在更多是企业护城河的表现,最终领域数据会融入主模型。
唐杰认为,AI的核心在于帮助人类完成工作、创造价值。若AI软件无法产生实际效用,则毫无生命力。
参考链接:唐杰微博
原文链接
本文链接:https://kx.umi6.com/article/30829.html
转载请注明文章出处
相关推荐
换一换
智谱首席科学家唐杰:很快将推出新一代模型GLM-5
2026-01-08 11:12:10
清华唐杰:领域大模型,伪命题
2025-12-26 17:51:02
智谱港交所敲钟上市,首席科学家唐杰要求公司全面回归基础模型研究
2026-01-08 12:07:27
从Seedance 2.0到AI天团!海淀何以“生成”全球爆款——
2026-02-15 20:40:46
沙特Humain公司向xAI公司投资30亿美元
2026-02-18 21:45:22
一黑客团伙凭AI工具 五周横扫数十个国家600个防火墙
2026-02-23 02:28:06
极限30天机器狗爆改大熊猫!揭秘春晚百台级机器人群控演出
2026-02-18 23:47:42
三个和尚没水喝!OpenAI星际之门搁浅,一年过去压根没动工
2026-02-23 15:34:57
刷新深空探测极限 我国科学家用天文AI模型绘制“极致深空图”
2026-02-20 17:36:47
微软CEO:很高兴能将Grok 4.1 Fast添加到多模型产品系列中
2026-02-20 15:32:15
阿里千问推出Qwen Coding Plan
2026-02-21 17:45:09
阿里Qwen3.5-Plus/Qwen3.5-397B-A17B新模型上线
2026-02-16 17:32:28
韩文秀:推动科技创新和产业创新深度融合 因地制宜发展新质生产力
2026-02-16 11:16:25
729 文章
496957 浏览
24小时热文
更多
-
2026-02-23 19:11:04 -
2026-02-23 19:09:59 -
2026-02-23 19:08:55