1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在大模型竞争中,算力与效率的平衡至关重要。端侧部署面临算力瓶颈,面壁智能与清华大学提出了不同于MoE的新路径——神经元级稀疏激活技术,既保持性能又大幅降低资源消耗。

这项技术源于脑科学灵感与工程创新结合。CFM是一种原生稀疏技术,通过模型自身的稀疏特性提升参数效率,显著减少内存占用。与MoE相比,CFM的稀疏粒度更精细,达到神经元级别,且具有更强的动态性,可根据任务需求灵活调整激活量。

肖朝军指出,虽然MoE在大规模模型中有优势,但其固定激活机制和负载均衡约束使其不适合端侧应用。而CFM无需这些限制,所有参数可统一计算,更适合手机等资源受限环境。

在模型架构方面,肖朝军认为Transformer仍是当前最优选择,尽管非Transformer架构如Mamba和RWKV在效率上有突破,但在效果上仍难以匹敌。他强调,Transformer的可扩展性是其成为主流的关键,并提到未来架构能否成功取决于是否能踩中硬件发展的机遇。

关于小模型,肖朝军表示目前尚无明确界定,但模型压缩极限仍未可知。他认为智能的本质更接近于抽象能力而非单纯压缩。面壁智能已在端侧场景中广泛应用小模型,并关注FP8等低精度计算的进展。

此外,长文本推理和思维链能力被视为Transformer未来的重要突破点。肖朝军指出,现有测试集难以全面评估这类能力,而创新则是下一个挑战。至于大模型的不可能三角问题,尽管有多种尝试,但尚未找到完美解决方案。

原文链接
本文链接:https://kx.umi6.com/article/17066.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
手机实现GPT级智能,比MoE更极致的稀疏技术:省内存效果不减|对话面壁&清华肖朝军
2025-04-12 15:48:51
工信部:实施工业互联网与人工智能融合赋能行动 推动人工智能技术在工业全链条渗透
2026-01-13 16:48:47
张文宏:拒绝把AI引入医院病历系统 医生需要训练专业诊断能力
2026-01-13 08:22:22
移远通信推出旗舰智能模组 SP895BD-AP,搭载高通跃龙 Q-8750 芯片
2026-01-12 16:44:03
工信部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》
2026-01-13 16:48:00
工信部部长李乐成:2026年将着重抓好“稳”“扩”“创”“增”四方面工作 保持工业经济平稳增长
2026-01-12 11:30:37
上海:支持发展AI微短剧
2026-01-13 10:29:09
工信部部长李乐成:深入实施“人工智能+制造”专项行动 培育一批重点行业智能体、智能原生企业
2026-01-12 11:32:51
信任与怀疑之间,我们如何与AI医生共存?
2026-01-13 11:34:11
国内首个农业开源大语言模型“司农”发布
2026-01-13 14:39:49
Anthropic CEO 自曝:Claude 本可抢跑 ChatGPT,我们按下了暂停键
2026-01-12 18:47:18
特朗普称微软将做出调整,确保美国人的电费不会因 AI 需求而上涨
2026-01-13 16:45:26
扎克伯格官宣 Meta Compute:布局“国家级”能源项目,打造全球顶级 AI 算力版图
2026-01-13 07:17:30
24小时热文
更多
扫一扫体验小程序