标题:对DeepSeek和智能下半场的几条判断
自24Q3以来,AI步入下半场。DeepSeek R1解决了强化学习(RL)的难题,推动行业进入新范式。AI竞赛如何进行?以下是过去半个月的思考总结。
下一个智能突破会在哪里出现?
如果你有充足资源,你会投入哪些方向?
例如下一代Transformer架构、合成数据的突破、更高效的在线学习方式。
DeepSeek超越OpenAI了吗?
DeepSeek无疑超越了Meta Llama,但在与OpenAI、Anthropic和Google等顶尖玩家的竞争中仍有差距。DeepSeek虽未发明新范式,但推动了RL和推理模型的新范式普及,提升了行业信心。
DeepSeek开启新范式了吗?
严格来说,DeepSeek并未发明新范式,但它推动了RL和推理模型的新范式,吸引了更多AI研究人员的关注,加速了行业进展。
Anthropic的技术路线与DeepSeek有何不同?
Anthropic认为base model与推理模型应是连续光谱,而非独立系列。他们在预训练阶段做了大量RL工作,这可能是Sonnet 3.5表现突出的原因。
DeepSeek的轰动有必然也有偶然
技术角度上,DeepSeek开源、成本低、联网+公开CoT等亮点使其脱颖而出。发布时机也增加了轰动效应。
谁受益谁受损?
ToC领域如Chatbot受影响最大;To Developer影响有限;To Enterprise和政府的决策较为复杂。开源和算力视角来看,短期闭源公司受冲击,中长期GPU充裕的公司受益。
蒸馏技术能否超越SOTA?
DeepSeek的效果取决于其是否在预训练阶段大量使用蒸馏CoT数据。蒸馏技术在基础模型上超越SOTA的可能性较小。
No Moat!
智能技术进步迅速,产品难以形成绝对壁垒,DeepSeek验证了模型即应用的观点。
DeepSeek应承接这波Chatbot流量吗?
DeepSeek尚未明确如何利用流量,这考验组织能力和战略选择。承接流量与否关乎商业公司与研究实验室能否共存。
下一个智能突破从何而来?
下一代模型和Agent落地是关键。在技术不确定性下,优秀的人才和充足资源是探索智能突破的关键。
DeepSeek让我对中国AI人才更有信心
希望技术无国界。
-
2025-10-25 13:24:28 -
2025-10-25 12:21:03 -
2025-10-25 12:20:19