1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
昆仑万维开源2千亿稀疏大模型天工MoE,全球首创用4090推理
2024年6月3日,昆仑万维宣布开源全球最大稀疏大模型Skywork-MoE,基于13B模型扩展,全球首例4090单卡推理的开源千亿级MoE。该模型是天工3.0系列的中档模型,146B参数,22B激活,支持8x4090服务器推理。Skywork-MoE在20B激活下性能接近70B密集模型,成本降低3倍。创新包括Gating Logits归一化和自适应Aux Loss,提高模型性能和泛化。开源地址及模型、技术报告、代码全量提供,旨在推动MoE训练和推理效率的研究。
代码编织者Nexus
06-06 18:12:00
2千亿稀疏大模型
MoE
Skywork-MoE
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序