2024年冬天,杭州一家名为“深度求索”的初创公司发布了全新大模型DeepSeek-V3。在多项基准测试中,它的性能超越了其他开源模型,甚至接近顶尖闭源模型GPT-4o。尤其在数学推理上,DeepSeek-V3表现出色。
DeepSeek-V3的研发成本仅为558万美元,远低于GPT-4o的成本。这让美国人感到震惊,反思大模型和算力的投资价值。更重要的是,DeepSeek-V3展示了中国的首创精神,采用了多项开创性技术,如MLA和DeepSeekMoE,提升了模型性能和训练效率。
DeepSeek背后的资方是一家低调的私募基金——幻方量化。该公司在2023年成立“深度求索”子公司,团队仅139人,远少于OpenAI的1200人。梁文峰,幻方量化的创始人,带领这支团队,凭借对AI和数学的深刻理解,创造了DeepSeek-V3。
梁文峰曾研究量化投资,2010年获得成功后转向AI领域。他坚信AI会改变世界,因此在2015年创立幻方量化,致力于打造顶级量化基金。为了支持AI发展,梁文峰大规模布局AI算力,包括“萤火一号”和“萤火二号”。
梁文峰强调,创新不仅仅是商业驱动的,还需要好奇心和创造欲。DeepSeek-V3的成功证明了中国企业在原创技术上的潜力,有望引领AI产业的新方向。
原文链接
本文链接:https://kx.umi6.com/article/11861.html
转载请注明文章出处
相关推荐
换一换
DeepSeek全尺寸模型上线阿里云百炼
2025-02-09 14:48:13
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
2025-04-01 13:26:23
DeepSeek-V3首个版本上线
2024-12-27 08:58:12
李彦宏迪拜最新讲话:创新的本质就是更低的成本
2025-02-11 21:04:43
百度智能云宣布上线DeepSeek-R1/V3
2025-02-03 20:16:14
美联储理事鲍曼:AI可以在货币政策中发挥越来越大的作用
2024-11-23 07:20:41
61岁退休后,华为海思创始总裁成了复旦北大清华老师
2025-10-18 14:34:04
大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o
2024-12-27 14:07:00
英伟达的最大空头出现了
2024-12-31 15:46:07
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
2025-03-25 23:20:38
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲
2024-12-27 08:55:04
一文看懂DeepSeek的中国式创新
2025-02-02 09:40:55
阿里通义灵码新增支持 DeepSeek-V3 / R1 模型,降低 AI 编程门槛
2025-02-13 17:20:53
579 文章
291125 浏览
24小时热文
更多
-
2025-10-24 08:30:42 -
2025-10-24 08:29:28 -
2025-10-24 08:28:19