元象XVERSE发布中国最大开源MoE模型——XVERSE-MoE-A36B,拥有255B参数,激活参数36B,性能媲美100B模型,训练时间缩短30%,推理性能提升100%,降低每token成本。此模型在多项权威评测中超越Skywork-MoE、Mixtral-8x22B及Grok-1-A86B等模型。
MoE(Mixture of Experts)模型通过组合多个专家模型实现跨级性能跃升,优化训练与推理效率,满足大模型扩展需求。元象XVERSE-MoE-A36B采用4D拓扑架构、高效专家路由与预丢弃策略、多维度通信与计算重叠机制,提升效率。专家权重通过实验对比优化,以实现最佳性能。
数据动态切换与学习率调度策略结合,使得模型在引入新数据时快速学习,持续提高性能。与XVERSE-65B-2相比,XVERSE-MoE-A36B在训练时间、推理性能及模型效果上均表现出色。
元象已将XVERSE-MoE-A36B与先前开源的XVERSE-65B及全球最长上下文窗口大模型纳入其高性能全家桶系列,无条件免费商用,旨在推动AI应用的普及。
基于MoE模型,元象自主研发的AI角色扮演与互动网文APP Saylo广受欢迎。此外,元象大模型已在AI角色、音乐助手、文化娱乐等领域实现商业化应用,与QQ音乐、虎牙直播、全民K歌、腾讯云等企业展开深度合作,为用户提供创新体验。
原文链接
本文链接:https://kx.umi6.com/article/6361.html
转载请注明文章出处
相关推荐
.png)
换一换
华为、中国移动、联通等宣布 openFuyao 开源发布,将致力于提供多样化算力集群软件生态
2025-05-26 21:49:09
DeepSeek-Prover-V2-671B 新模型开源发布
2025-04-30 19:50:58
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
2025-05-20 14:38:41
大模型呼唤开源多模态 AI加速冲刺物理世界
2025-06-07 14:50:49
中国AI 大厂,被Deepseek 掀了牌桌之后
2025-05-19 13:16:00
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1
2025-04-30 18:54:08
字节跳动开源 Deep Research 项目 DeerFlow:可生成图文报告、语音播客
2025-05-10 21:11:54
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
Coze/Dify/FastGPT/N8N :该如何选择Agent平台?
2025-06-09 10:25:58
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
SOTA自动绑骨开源框架来了!3D版DeepSeek开源月大礼包持续开箱ing
2025-04-11 17:59:12
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
2025-05-09 21:57:02
495 文章
179267 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24