对DeepSeek和智能下半场的几条判断

2025-02-08 08:19:14

超频思维站

发布在

科普

阅读：234

标题：对DeepSeek和智能下半场的几条判断

自24Q3以来，AI步入下半场。DeepSeek R1解决了强化学习（RL）的难题，推动行业进入新范式。AI竞赛如何进行？以下是过去半个月的思考总结。

下一个智能突破会在哪里出现？

如果你有充足资源，你会投入哪些方向？

例如下一代Transformer架构、合成数据的突破、更高效的在线学习方式。

DeepSeek超越OpenAI了吗？

DeepSeek无疑超越了Meta Llama，但在与OpenAI、Anthropic和Google等顶尖玩家的竞争中仍有差距。DeepSeek虽未发明新范式，但推动了RL和推理模型的新范式普及，提升了行业信心。

DeepSeek开启新范式了吗？

严格来说，DeepSeek并未发明新范式，但它推动了RL和推理模型的新范式，吸引了更多AI研究人员的关注，加速了行业进展。

Anthropic的技术路线与DeepSeek有何不同？

Anthropic认为base model与推理模型应是连续光谱，而非独立系列。他们在预训练阶段做了大量RL工作，这可能是Sonnet 3.5表现突出的原因。

DeepSeek的轰动有必然也有偶然

技术角度上，DeepSeek开源、成本低、联网+公开CoT等亮点使其脱颖而出。发布时机也增加了轰动效应。

谁受益谁受损？

ToC领域如Chatbot受影响最大；To Developer影响有限；To Enterprise和政府的决策较为复杂。开源和算力视角来看，短期闭源公司受冲击，中长期GPU充裕的公司受益。

蒸馏技术能否超越SOTA？

DeepSeek的效果取决于其是否在预训练阶段大量使用蒸馏CoT数据。蒸馏技术在基础模型上超越SOTA的可能性较小。

No Moat！

智能技术进步迅速，产品难以形成绝对壁垒，DeepSeek验证了模型即应用的观点。

DeepSeek应承接这波Chatbot流量吗？

DeepSeek尚未明确如何利用流量，这考验组织能力和战略选择。承接流量与否关乎商业公司与研究实验室能否共存。

下一个智能突破从何而来？

下一代模型和Agent落地是关键。在技术不确定性下，优秀的人才和充足资源是探索智能突破的关键。

DeepSeek让我对中国AI人才更有信心

希望技术无国界。

原文链接

本文链接：https://kx.umi6.com/article/12873.html

转载请注明文章出处

AI race

DeepSeek

智能下半场

分享至

打开微信扫一扫

内容投诉

生成图片

超频思维站

602 文章

276584 浏览

24小时热文