2025年9月11日,百度开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜,位列文本模型第一、总榜第三。该模型采用混合专家(MoE)架构,总参数规模达21B,每个token激活3B参数,支持128K上下文窗口,擅长复杂推理任务。其在逻辑推理、数学、科学、代码生成等领域表现显著提升,且具备高效工具调用能力。作为轻量级模型,其性能接近业界顶级大尺寸模型。此前,在WAVE SUMMIT 2025大会上,百度还发布了文心大模型X1.1,进一步提升深度思考能力。
原文链接
本文链接:https://kx.umi6.com/article/25075.html
转载请注明文章出处
相关推荐
换一换
HuggingFace上的热门开源模型,一半都来自中国了
2025-03-12 12:21:32
6B文生图模型,上线即登顶抱抱脸
2025-12-01 17:19:39
DeepSeek-R1持续刷屏,连Open R1都来了!抱抱脸发起,1天狂揽1.9k星
2025-01-26 12:10:08
人人都能玩得起 AI 机器人,HuggingFace 开源低成本解决方案 LeRobot
2024-08-29 14:56:08
权威榜单发布,全球开源大模型前十均为阿里通义千问衍生模型
2025-02-10 16:10:32
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
2026-04-24 13:09:49
英特尔CEO:半导体行业整体潜在市场规模已逼近1万亿美元
2026-04-24 12:11:28
昆仑万维2025年营收同比增长44.78%至81.98亿 “4+3”战略构建AI Native平台经济新范式
2026-04-23 21:31:07
科大讯飞发布燎原N30m笔记本,重塑全栈国产AIPC新标杆
2026-04-22 21:27:36
京东方申请注册AI工厂商标
2026-04-24 13:12:56
中金公司:公募一季度大幅加仓偏AI产业链硬件端通信行业 减仓有色和电子
2026-04-23 09:00:20
谷歌云与CVC达成合作 加速智能体AI转型
2026-04-23 20:28:51
Mobileye 2026财年一季度营收增长27%,自动驾驶商业化进程持续推进
2026-04-24 18:24:51
672 文章
530626 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21