1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2024年冬天,杭州一家名为“深度求索”的初创公司发布了全新大模型DeepSeek-V3。在多项基准测试中,它的性能超越了其他开源模型,甚至接近顶尖闭源模型GPT-4o。尤其在数学推理上,DeepSeek-V3表现出色。

DeepSeek-V3的研发成本仅为558万美元,远低于GPT-4o的成本。这让美国人感到震惊,反思大模型和算力的投资价值。更重要的是,DeepSeek-V3展示了中国的首创精神,采用了多项开创性技术,如MLA和DeepSeekMoE,提升了模型性能和训练效率。

DeepSeek背后的资方是一家低调的私募基金——幻方量化。该公司在2023年成立“深度求索”子公司,团队仅139人,远少于OpenAI的1200人。梁文峰,幻方量化的创始人,带领这支团队,凭借对AI和数学的深刻理解,创造了DeepSeek-V3。

梁文峰曾研究量化投资,2010年获得成功后转向AI领域。他坚信AI会改变世界,因此在2015年创立幻方量化,致力于打造顶级量化基金。为了支持AI发展,梁文峰大规模布局AI算力,包括“萤火一号”和“萤火二号”。

梁文峰强调,创新不仅仅是商业驱动的,还需要好奇心和创造欲。DeepSeek-V3的成功证明了中国企业在原创技术上的潜力,有望引领AI产业的新方向。

原文链接
本文链接:https://kx.umi6.com/article/11861.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
2025-02-07 23:07:43
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
如何看待“人才交流型并购”
2025-06-10 13:49:38
大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o
2024-12-27 14:07:00
李彦宏谈DeepSeek:我们到处都能看到创新,因此必须适应这种快速变化
2025-02-11 20:01:01
AMD:已将 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,利用 SGLang 彻底改变 AI 开发
2025-01-25 18:01:34
奥特曼最新访谈认可「套壳」
2025-04-08 12:51:05
李彦宏迪拜最新讲话:创新的本质就是更低的成本
2025-02-11 21:04:43
苹果会成为第一家因为AI而掉队的巨头么?
2025-03-23 14:09:26
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样
2025-04-07 16:00:26
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
2025-03-25 22:18:23
深度拆解:DeepSeek-V3是怎么训练的
2024-12-30 21:30:52
创新构筑业绩增长新引擎 上市民企上半年迸发新活力
2025-08-21 08:26:52
24小时热文
更多
扫一扫体验小程序