DeepSeek在2024年底发布新一代MoE模型V3及推理模型R1,凭借高性能和低训练成本引爆全球。其V3模型仅用2048张英伟达H800 GPU,成本约557.6万美元,远低于Llama-3.1和GPT-4o。DeepSeek的开源和创新技术迫使Meta和英伟达面临挑战,前者研究小组分析DeepSeek模型,后者市值一度蒸发近6000亿美元。DeepSeek的崛起促使全球云厂商和国产芯片厂商迅速跟进,华为、腾讯、阿里等纷纷接入DeepSeek模型。DeepSeek的成功还引发行业对开源与闭源模式的重新审视,百度宣布开源文心大模型4.5系列。教育、证券等行业也广泛接入DeepSeek,推动AI应用多元化发展。
原文链接
本文链接:https://kx.umi6.com/article/13415.html
转载请注明文章出处
相关推荐
.png)
换一换
AI转型路线图:企业面临这些关键挑战
2025-02-11 19:01:39
边投资边定增!北京利尔跨界AI芯片,商汤加持效应待考
2025-05-13 20:57:01
全国政协委员申长雨:加强人工智能领域知识产权保护
2025-03-08 23:13:05
447 文章
69882 浏览
24小时热文
更多

-
2025-07-19 11:52:20
-
2025-07-19 11:51:22
-
2025-07-19 10:50:54