2026年1月,欧洲版OpenAI公司Mistral的CEO Arthur Mensch在访谈中声称,中国开源模型DeepSeek-V3基于其团队提出的架构构建,此言论引发争议。网友指出,DeepSeek-V3与Mistral的Mixtral论文发布时间仅相差3天,且两者的架构思路和数学公式存在显著差异。DeepSeek通过细粒度专家分割和改进路由机制实现算法创新,而Mixtral更偏向工程优化。此外,Mistral 3 Large被曝直接沿用DeepSeek-V3架构,进一步加剧批评。Arthur Mensch的发言被质疑试图‘岁月史书’以挽回面子,网友对Mistral的态度从赞赏转为不满。目前,DeepSeek正瞄准春节档发布新模型,竞争愈发激烈。
原文链接
本文链接:https://kx.umi6.com/article/32152.html
转载请注明文章出处
相关推荐
换一换
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
2025-02-07 23:07:43
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025-08-14 16:57:45
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
2025-03-25 23:20:38
深度拆解:DeepSeek-V3是怎么训练的
2024-12-30 21:30:52
DeepSeek全尺寸模型上线阿里云百炼
2025-02-09 14:48:13
OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!
2024-12-31 10:39:20
商汤大装置上架DeepSeek系列模型
2025-02-08 19:34:28
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
国产开源模型,代码能力比肩 Claude,DeepSeek-V3 正式发布
2024-12-30 11:15:36
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
2025-06-11 09:04:46
京东云上线DeepSeek-R1/V3
2025-02-05 11:06:47
消息称 ASML 承诺入股法国 AI 企业 Mistral,将成后者最大股东
2025-09-08 08:57:36
AMD:已将 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上,利用 SGLang 彻底改变 AI 开发
2025-01-25 18:01:34
747 文章
656172 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41