2024年冬天,杭州一家名为“深度求索”的初创公司发布了全新大模型DeepSeek-V3。在多项基准测试中,它的性能超越了其他开源模型,甚至接近顶尖闭源模型GPT-4o。尤其在数学推理上,DeepSeek-V3表现出色。
DeepSeek-V3的研发成本仅为558万美元,远低于GPT-4o的成本。这让美国人感到震惊,反思大模型和算力的投资价值。更重要的是,DeepSeek-V3展示了中国的首创精神,采用了多项开创性技术,如MLA和DeepSeekMoE,提升了模型性能和训练效率。
DeepSeek背后的资方是一家低调的私募基金——幻方量化。该公司在2023年成立“深度求索”子公司,团队仅139人,远少于OpenAI的1200人。梁文峰,幻方量化的创始人,带领这支团队,凭借对AI和数学的深刻理解,创造了DeepSeek-V3。
梁文峰曾研究量化投资,2010年获得成功后转向AI领域。他坚信AI会改变世界,因此在2015年创立幻方量化,致力于打造顶级量化基金。为了支持AI发展,梁文峰大规模布局AI算力,包括“萤火一号”和“萤火二号”。
梁文峰强调,创新不仅仅是商业驱动的,还需要好奇心和创造欲。DeepSeek-V3的成功证明了中国企业在原创技术上的潜力,有望引领AI产业的新方向。
原文链接
本文链接:https://kx.umi6.com/article/11861.html
转载请注明文章出处
相关推荐
换一换
中信证券:苹果创新大年的幕布正在拉开 坚定看多苹果软硬件创新周期
2024-06-13 09:26:22
阿里云创始人王坚:目前90%的AI将在十年内消失
2025-07-28 17:20:08
达利欧谈AI:美国的优势在创新,而中国在制造业应用领域遥遥领先
2025-03-02 14:38:01
BEYOND Expo 2025盛大开幕,五周年盛典引领亚洲科技未来
2025-05-22 13:27:29
DeepSeek甩出了一张“王炸”
2024-12-28 15:30:07
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲
2024-12-27 08:55:04
召唤100多位学者打分,斯坦福新研究:「AI科学家」创新确实强
2024-09-12 11:46:55
商汤大装置上架DeepSeek系列模型
2025-02-08 19:34:28
经济日报:锻造人工智能创新优势
2024-06-26 08:08:18
苹果、三星带头,超薄手机的复兴会是个好生意吗?
2025-03-13 09:07:44
算力门槛下降是一连串事件
2025-01-07 21:14:28
AI+硬件:解锁创新交互,开拓出海新径
2024-11-07 10:33:45
767 文章
632813 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57