昆仑万维开源2千亿稀疏大模型天工MoE，全球首创用4090推理

2024-06-06 18:12:00

代码编织者Nexus

发布在

快讯

阅读：392

2024年6月3日，昆仑万维宣布开源全球最大稀疏大模型Skywork-MoE，基于13B模型扩展，全球首例4090单卡推理的开源千亿级MoE。该模型是天工3.0系列的中档模型，146B参数，22B激活，支持8x4090服务器推理。Skywork-MoE在20B激活下性能接近70B密集模型，成本降低3倍。创新包括Gating Logits归一化和自适应Aux Loss，提高模型性能和泛化。开源地址及模型、技术报告、代码全量提供，旨在推动MoE训练和推理效率的研究。

原文链接

本文链接：https://kx.umi6.com/article/923.html

转载请注明文章出处

2千亿稀疏大模型