2025年7月,MoonShot发布开源大模型K2,参数规模达万亿级别(1T),成为当前开源模型中最大。K2在多项基准测试中表现优异,性价比高,支持上下文长度达128K,迅速登上HuggingFace热度榜首,并获硅谷开发者青睐。相比DeepSeek的R1和Meta的Llama4,K2以更低训练成本和技术优势引发关注,其架构优化及自研技术(如MuonClip优化器和QK-Clip)进一步提升效率。与此同时,MoonShot与MiniMax等中国AI企业正主导全球开源模型创新趋势,展现底层研发能力。K2的多智能体协作能力或成商业市场关键,MoonShot未来可能迈向上市。
原文链接
本文链接:https://kx.umi6.com/article/21682.html
转载请注明文章出处
相关推荐
.png)
换一换
被AI「摩擦」的十天:一个普通人的上手记
2025-08-16 18:28:03
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
2025-07-21 11:16:03
调查 | 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎
2025-08-04 11:56:14
国产开源模型强势追击!DeepSeek与OpenAI最新模型实测对决
2025-05-29 16:40:22
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
DeepSeek给中国软件埋了一个「地雷」?
2025-06-24 09:14:11
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
2025-07-21 21:22:47
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
2025-06-13 16:11:09
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
阿里千问与DeepSeek入选全球AI开源贡献榜前十
2025-06-12 18:42:16
郑州:深化与DeepSeek等人工智能头部企业的合作
2025-06-24 20:22:15
DeepSeek开源新版R1 媲美OpenAI最高o3模型
2025-05-29 05:51:14
英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型
2025-05-30 21:55:28
542 文章
266200 浏览
24小时热文
更多

-
2025-10-23 11:04:07
-
2025-10-23 11:03:14
-
2025-10-23 11:03:01