2026年1月,欧洲版OpenAI公司Mistral的CEO Arthur Mensch在访谈中声称,中国开源模型DeepSeek-V3基于其团队提出的架构构建,此言论引发争议。网友指出,DeepSeek-V3与Mistral的Mixtral论文发布时间仅相差3天,且两者的架构思路和数学公式存在显著差异。DeepSeek通过细粒度专家分割和改进路由机制实现算法创新,而Mixtral更偏向工程优化。此外,Mistral 3 Large被曝直接沿用DeepSeek-V3架构,进一步加剧批评。Arthur Mensch的发言被质疑试图‘岁月史书’以挽回面子,网友对Mistral的态度从赞赏转为不满。目前,DeepSeek正瞄准春节档发布新模型,竞争愈发激烈。
原文链接
本文链接:https://kx.umi6.com/article/32152.html
转载请注明文章出处
相关推荐
换一换
梁文锋等发表DeepSeek V3回顾性论文
2025-05-16 17:08:55
DeepSeek全尺寸模型上线阿里云百炼
2025-02-09 14:48:13
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
DeepSeek-V3模型更新,各项能力全面进阶
2025-03-25 23:21:40
Mistral免费上新一系列ChatGPT同款功能
2024-11-20 17:17:29
DeepSeek又更新了!化身更强AI设计师、程序员 比肩全球最强代码生成器?
2025-03-25 09:48:08
法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源
2025-06-11 09:04:46
英伟达的最大空头出现了
2024-12-31 15:46:07
欧洲「OpenAI」崛起:Mistral一年估值暴涨至60亿,60人团队创奇迹
2024-06-12 13:59:07
Mistral 发布 Pixtral Large 多模态 AI 模型:登顶复杂数学推理,图表 / 文档推理超过 GPT-4o
2024-11-19 15:47:33
DeepSeek预示算力需求“打骨折”?业界:别只盯着训练 AI行业进入推理时代
2024-12-30 09:15:53
Pixtral 12B 发布:Mistral 首款多模态 AI 模型,120 亿参数、24GB 大小
2024-09-12 08:44:13
京东云上线DeepSeek-R1/V3
2025-02-05 11:06:47
670 文章
440724 浏览
24小时热文
更多
-
2026-01-31 16:46:37 -
2026-01-31 15:44:24 -
2026-01-31 15:43:18