1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2024年冬天,杭州一家名为“深度求索”的初创公司发布了全新大模型DeepSeek-V3。在多项基准测试中,它的性能超越了其他开源模型,甚至接近顶尖闭源模型GPT-4o。尤其在数学推理上,DeepSeek-V3表现出色。

DeepSeek-V3的研发成本仅为558万美元,远低于GPT-4o的成本。这让美国人感到震惊,反思大模型和算力的投资价值。更重要的是,DeepSeek-V3展示了中国的首创精神,采用了多项开创性技术,如MLA和DeepSeekMoE,提升了模型性能和训练效率。

DeepSeek背后的资方是一家低调的私募基金——幻方量化。该公司在2023年成立“深度求索”子公司,团队仅139人,远少于OpenAI的1200人。梁文峰,幻方量化的创始人,带领这支团队,凭借对AI和数学的深刻理解,创造了DeepSeek-V3。

梁文峰曾研究量化投资,2010年获得成功后转向AI领域。他坚信AI会改变世界,因此在2015年创立幻方量化,致力于打造顶级量化基金。为了支持AI发展,梁文峰大规模布局AI算力,包括“萤火一号”和“萤火二号”。

梁文峰强调,创新不仅仅是商业驱动的,还需要好奇心和创造欲。DeepSeek-V3的成功证明了中国企业在原创技术上的潜力,有望引领AI产业的新方向。

原文链接
本文链接:https://kx.umi6.com/article/11861.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
苹果、三星带头,超薄手机的复兴会是个好生意吗?
2025-03-13 09:07:44
微软大中华区董事长侯阳将出任新一届企业创新创投联盟联席理事长
2024-07-10 17:40:57
阿里通义灵码新增支持 DeepSeek-V3 / R1 模型,降低 AI 编程门槛
2025-02-13 17:20:53
全国人大代表、步长制药赵菁:“人工智能+”进入爆发临界点 建议利用AI赋能中医药传承创新 |两会时间
2025-03-07 10:56:29
达利欧谈AI:美国的优势在创新,而中国在制造业应用领域遥遥领先
2025-03-02 14:38:01
Manus再次燃爆AI界,“套壳”还是创新?
2025-03-07 20:10:01
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
2025-04-01 13:26:23
谷歌DeepMind CEO:中国的AI模型仅落后美国几个月
2026-01-16 15:53:46
深度拆解:DeepSeek-V3是怎么训练的
2024-12-30 21:30:52
大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o
2024-12-27 14:07:00
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
阿里云创始人王坚:目前90%的AI将在十年内消失
2025-07-28 17:20:08
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
24小时热文
更多
扫一扫体验小程序