混合专家 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载，模型权重与技术细节全面公开

10月16日，华为宣布盘古Ultra-MoE-718B-V1.1大模型正式开源，模型权重与技术细节全面公开，可在GitCode平台下载。该模型基于昇腾NPU训练，总参数规模达718B，激活参数量为39B，融合“快思考”与“慢思考”能力，支持多轮工具调用和模式切换。相比V1.0版本，V1.1在幻觉控制、工具调用及综合性能上显著提升，幻觉率从10.11%降至3.85%，并新增Int8量化版本，显存占用减少一半，吞吐提升20%。此前，该模型在SuperCLUE榜单中位列开源模型第三，尤其在数学推理、代码生成等领域表现优异。硬件需Atlas 800T A2（≥32卡）支持。官方地址已公布。

原文链接

量子思考者

10-16 17:57:55

华为盘古

开源模型

混合专家

分享至

打开微信扫一扫

内容投诉

生成图片

美团发布并开源混合专家模型：5600亿参数只激活5％就有奇效

正文：2025年9月1日，美团发布并开源了LongCat-Flash-Chat AI模型，采用混合专家架构，总参数量达5600亿，但仅激活5%即可实现高效性能。该模型在智能体任务、推理速度及成本控制上表现突出，尤其适合复杂场景应用。其创新的“零计算专家”机制和跨层通道设计优化了算力分配与训练效率，在H800 GPU上实现100+ tokens/s推理速度，输出成本低至5元/百万token。基准测试中，LongCat-Flash在多项指标中名列前茅，例如ArenaHard-V2得分86.50，MMLU得分89.71，并在智能体工具使用和编程任务中超越更大规模模型。美团已提供SGLang和vLLM两种部署方案，代码以MIT License开源，用户可自由用于研究或蒸馏新模型。详情见其官方资源及相关页面。

原文链接

LunarCoder

09-01 13:18:39

LongCat-Flash-Chat

混合专家模型

美团

分享至

打开微信扫一扫

内容投诉

生成图片

消息称智谱 GLM-4.5 今晚开源新模型，知情人士回应确有其事

7月28日，据IT之家报道，智谱AI计划于今晚开源其GLM-4.5系列新模型。知情人士向新浪科技确认了这一消息。根据此前modelscope/ms-swift代码库的commit记录，GLM-4.5系列预计将采用全新的混合专家（MoE）结构，是一款多模态可扩展大模型，包含GLM-4.5（355B-A32B）和GLM-4.5-Air（106B-A12B）两款版本。该模型支持高吞吐推理、工具调用解析、分布式负载均衡等功能，并具备文本、图像、视觉扩展等多模态处理能力。此次发布可能为AI领域带来技术革新，引发广泛关注。

原文链接

AI奇点纪元

07-28 16:20:04

开源模型

智谱GLM-4.5

混合专家结构

分享至

打开微信扫一扫

内容投诉

生成图片

智谱 GLM-4.5 系列 AI 模型踪迹曝光，预估采用新混合专家架构

7月25日，智谱AI模型GLM-4.5系列踪迹曝光，预计采用全新混合专家（MoE）架构，定位为多模态可扩展大模型。该系列包括GLM-4.5（355B-A32B）和GLM-4.5-Air（106B-A12B）两款模型，支持文本、图像、视觉扩展等多模态功能。新架构具备高吞吐推理、分布式负载均衡、工具调用解析等特性，并新增推理解析器与多token预测能力。相关代码与特性已在modelscope/ms-swift代码库中显示，或成AI领域新突破。

原文链接

未来编码者

07-25 14:26:13

GLM-4.5

智谱

混合专家架构

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek发布Prover-V2模型参数量达6710亿

今日，《科创板日报》报道，人工智能公司DeepSeek在AI开源社区Hugging Face发布了全新模型DeepSeek-Prover-V2-671B。该模型参数量高达6710亿，是Prover-V1.5的升级版，采用更高效的safetensors文件格式并支持多计算精度，便于快速训练与部署。其架构基于DeepSeek-V3，运用MoE混合专家模式，含61层Transformer层及7168维隐藏层，支持超长上下文，最大位置嵌入达16.38万，可高效处理复杂数学证明任务。此外，模型通过FP8量化技术优化推理效率，减小模型体积。此模型的发布标志着深度学习领域的重要进展，值得关注。

原文链接

元界筑梦师

04-30 20:46:01

DeepSeek-Prover-V2-671B

模型参数

混合专家

分享至

打开微信扫一扫

内容投诉

生成图片

Meta发布开源大模型Llama 4，首次采用“混合专家”架构

Meta于4月5日推出最新开源AI模型Llama 4，包含Scout和Maverick两个版本。Llama 4首次采用混合专家(MoE)架构，能高效处理文本、视频、图像和音频等多模态数据。Scout拥有170亿活跃参数、16个专家模型，总参数1090亿；Maverick同样170亿活跃参数，但扩展至128个专家模型，总参数达4000亿。Behemoth作为更强大的模型正在研发中，被Meta视为“教师模型”。这些模型均基于大量未标注数据训练，具备广泛视觉理解能力。Scout和Maverick已开放下载，支持多平台获取，Meta AI已升级至Llama 4并覆盖40国，但多模态功能暂限美国英语。Meta CEO扎克伯格强调开源共享愿景，同时承认Llama 4开发延迟源于技术基准未达标及对话模拟能力不足等问题。Meta计划今年投入650亿美元扩展AI基础设施，面临投资者对回报的质疑。

原文链接

AI奇点纪元

04-06 06:46:52

Llama 4

Meta

混合专家架构

分享至

打开微信扫一扫

内容投诉

生成图片

一文详解：DeepSeek刚开源的DeepGEMM是怎么回事？

标题：DeepSeek开源的DeepGEMM详解 DeepSeek开源周第三天发布了专为Hopper架构GPU优化的矩阵乘法库——DeepGEMM。该库支持标准矩阵计算和混合专家模型（MoE）计算，在Hopper GPU上达到1350+FP8 TFLOPS的高性能。 DeepGEMM核心代码仅约30...

原文链接

像素宇宙

02-26 14:36:20

DeepGEMM

GPU优化

混合专家模型

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

2月25日，DeepSeek在开源周上发布了DeepEP，首个用于MoE模型训练和推理的EP通信库。该库支持高效全对全通信及低精度运算，兼容现代高性能计算需求。特别优化了NVLink到RDMA的非对称带宽转发场景，提供高吞吐量和SM数量控制。对于延迟敏感的推理解码，DeepEP还提供纯RDMA低延迟内核，支持自适应路由，满足多样化GPU资源需求。

原文链接