1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2024年冬天,杭州一家名为“深度求索”的初创公司发布了全新大模型DeepSeek-V3。在多项基准测试中,它的性能超越了其他开源模型,甚至接近顶尖闭源模型GPT-4o。尤其在数学推理上,DeepSeek-V3表现出色。

DeepSeek-V3的研发成本仅为558万美元,远低于GPT-4o的成本。这让美国人感到震惊,反思大模型和算力的投资价值。更重要的是,DeepSeek-V3展示了中国的首创精神,采用了多项开创性技术,如MLA和DeepSeekMoE,提升了模型性能和训练效率。

DeepSeek背后的资方是一家低调的私募基金——幻方量化。该公司在2023年成立“深度求索”子公司,团队仅139人,远少于OpenAI的1200人。梁文峰,幻方量化的创始人,带领这支团队,凭借对AI和数学的深刻理解,创造了DeepSeek-V3。

梁文峰曾研究量化投资,2010年获得成功后转向AI领域。他坚信AI会改变世界,因此在2015年创立幻方量化,致力于打造顶级量化基金。为了支持AI发展,梁文峰大规模布局AI算力,包括“萤火一号”和“萤火二号”。

梁文峰强调,创新不仅仅是商业驱动的,还需要好奇心和创造欲。DeepSeek-V3的成功证明了中国企业在原创技术上的潜力,有望引领AI产业的新方向。

原文链接
本文链接:https://kx.umi6.com/article/11861.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
生成式人工智能用户约2.5亿人 这个“2.5亿”意味着什么?
2025-02-19 08:43:06
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
2025-03-25 22:18:23
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
TCL中环张雪囡:创新和资本,光伏周期下优胜劣汰的关键因素
2024-12-13 14:26:28
DeepSeek全尺寸模型上线阿里云百炼
2025-02-09 14:48:13
61岁退休后,华为海思创始总裁成了复旦北大清华老师
2025-10-18 14:34:04
美联储理事鲍曼:AI可以在货币政策中发挥越来越大的作用
2024-11-23 07:20:41
苹果陷入创新瓶颈:AI 竞赛掉队 下个爆款遥遥无期
2025-02-03 13:08:32
小米2024黑客马拉松:319 位小米人产出63个新技术作品
2024-07-10 10:16:54
DeepSeek-V3横空出世,浙江私募力量震惊硅谷
2025-01-18 19:38:08
创新构筑业绩增长新引擎 上市民企上半年迸发新活力
2025-08-21 08:26:52
算力门槛下降是一连串事件
2025-01-07 21:14:28
24小时热文
更多
扫一扫体验小程序