1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:对DeepSeek和智能下半场的几条判断

自24Q3以来,AI步入下半场。DeepSeek R1解决了强化学习(RL)的难题,推动行业进入新范式。AI竞赛如何进行?以下是过去半个月的思考总结。

下一个智能突破会在哪里出现?

如果你有充足资源,你会投入哪些方向?

例如下一代Transformer架构、合成数据的突破、更高效的在线学习方式。

DeepSeek超越OpenAI了吗?

DeepSeek无疑超越了Meta Llama,但在与OpenAI、Anthropic和Google等顶尖玩家的竞争中仍有差距。DeepSeek虽未发明新范式,但推动了RL和推理模型的新范式普及,提升了行业信心。

DeepSeek开启新范式了吗?

严格来说,DeepSeek并未发明新范式,但它推动了RL和推理模型的新范式,吸引了更多AI研究人员的关注,加速了行业进展。

Anthropic的技术路线与DeepSeek有何不同?

Anthropic认为base model与推理模型应是连续光谱,而非独立系列。他们在预训练阶段做了大量RL工作,这可能是Sonnet 3.5表现突出的原因。

DeepSeek的轰动有必然也有偶然

技术角度上,DeepSeek开源、成本低、联网+公开CoT等亮点使其脱颖而出。发布时机也增加了轰动效应。

谁受益谁受损?

ToC领域如Chatbot受影响最大;To Developer影响有限;To Enterprise和政府的决策较为复杂。开源和算力视角来看,短期闭源公司受冲击,中长期GPU充裕的公司受益。

蒸馏技术能否超越SOTA?

DeepSeek的效果取决于其是否在预训练阶段大量使用蒸馏CoT数据。蒸馏技术在基础模型上超越SOTA的可能性较小。

No Moat!

智能技术进步迅速,产品难以形成绝对壁垒,DeepSeek验证了模型即应用的观点。

DeepSeek应承接这波Chatbot流量吗?

DeepSeek尚未明确如何利用流量,这考验组织能力和战略选择。承接流量与否关乎商业公司与研究实验室能否共存。

下一个智能突破从何而来?

下一代模型和Agent落地是关键。在技术不确定性下,优秀的人才和充足资源是探索智能突破的关键。

DeepSeek让我对中国AI人才更有信心

希望技术无国界。

原文链接
本文链接:https://kx.umi6.com/article/12873.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
2025-09-22 21:02:17
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗
2025-08-06 12:31:08
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
DeepSeek 新模型曝光:MODEL1 代码预示新架构,最快有望 2 月发布
2026-01-21 09:02:53
K2开源大模型,会是Kimi的DeepSeek时刻吗?
2025-07-14 11:19:10
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚 36% 傲视群雄
2025-10-22 08:40:07
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
DeepSeek:正测试新的长文本模型结构 支持1M上下文
2026-02-13 20:39:39
24小时热文
更多
扫一扫体验小程序