DeepSeek公司发布了全新AI模型DeepSeek-V3,仅用2048块H800显卡、耗时两个月便训练出6710亿参数模型,效率比Meta高11倍。DeepSeek-V3采用MoE架构和MLA机制,结合FP8混合精度框架和DualPipe算法,大幅提升了训练效率。这一成就在芯片受限环境下尤为突出,显示了软件创新突破硬件限制的潜力。DeepSeek-V3的成功引发了市场对AI领域‘卖铲人’地位变化的担忧,英伟达股价一度下跌。
原文链接
本文链接:https://kx.umi6.com/article/11196.html
转载请注明文章出处
相关推荐
换一换
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
新研究:人类读指针式时钟准确率达 89.1%,顶尖 AI 仅 13.3%
2025-09-14 16:42:29
亚马逊云科技发布 Nova 2 系列 AI 模型,同步推出 Nova Forge 定制服务
2025-12-03 09:12:53
AI混战日
2025-08-06 13:31:19
最新研究:AI已经能在几分钟内通过CFA最难级别考试
2025-09-24 22:51:32
OpenAI 想赢的不是下一次发布会,而是下一代入口
2025-12-19 21:10:33
人类VS AI:波兰程序员10小时编程马拉松中击败OpenAI!
2025-07-20 19:08:20
OpenAI将全面杀入企业级市场
2026-01-04 16:14:13
看完最新国产AI写的公众号文章 我慌了
2025-12-10 18:05:25
腾讯混元开源端到端 AI 模型 Hunyuan-Foley:视频 + 文字 =“电影级”音效
2025-08-28 13:23:33
帮你识别一下关于AI的那些“装腔作势”
2025-07-24 09:02:57
宇树科技创始人王兴兴:目前AI模型难以真正驱动机器人做事
2025-09-11 12:54:53
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
2025-07-26 17:45:10
722 文章
563280 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21