2026年1月,欧洲版OpenAI公司Mistral的CEO Arthur Mensch在访谈中声称,中国开源模型DeepSeek-V3基于其团队提出的架构构建,此言论引发争议。网友指出,DeepSeek-V3与Mistral的Mixtral论文发布时间仅相差3天,且两者的架构思路和数学公式存在显著差异。DeepSeek通过细粒度专家分割和改进路由机制实现算法创新,而Mixtral更偏向工程优化。此外,Mistral 3 Large被曝直接沿用DeepSeek-V3架构,进一步加剧批评。Arthur Mensch的发言被质疑试图‘岁月史书’以挽回面子,网友对Mistral的态度从赞赏转为不满。目前,DeepSeek正瞄准春节档发布新模型,竞争愈发激烈。
原文链接
本文链接:https://kx.umi6.com/article/32152.html
转载请注明文章出处
相关推荐
换一换
Mistral 推出 Voxtral 系列语音理解模型:以开源形式提供出色正确率表现
2025-07-16 17:10:15
商汤大装置上架DeepSeek系列模型
2025-02-08 19:34:28
阿里云 PAI 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
2025-02-07 23:07:43
DeepSeek预示算力需求“打骨折”?业界:别只盯着训练 AI行业进入推理时代
2024-12-30 09:15:53
Deepseek新模型意外曝光!编程跑分一举超越Claude 3.5 Sonnet
2024-12-26 14:33:17
DeepSeek-V3 模型完成小版本升级,已可试用体验
2025-03-24 22:18:43
欧洲AI“全村希望”Mistral目标上市 展望行业风向已从模型转向系统
2025-01-22 01:45:56
新iPhone的AI怎么样,得看苹果最近的收购了
2025-08-27 16:05:37
法国力推 Mistral 和 OpenAI 打擂台,计划 2025 年秋季建成欧洲最大 AI 超算
2025-02-11 08:41:56
英伟达的最大空头出现了
2024-12-31 15:46:07
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
京东云上线DeepSeek-R1/V3
2025-02-05 11:06:47
DeepSeek-V3低调发布后 业内震惊之余再次怀疑硅谷模式
2025-03-25 12:55:22
721 文章
562517 浏览
24小时热文
更多
-
2026-04-24 16:22:09 -
2026-04-24 16:21:03 -
2026-04-24 16:19:57