2024-08-23 13:13:45
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
阅读:1094
浪潮信息于8月23日发布源2.0-M32大模型的4bit和8bit量化版,该版本旨在通过量化模型精度至int4和int8级别,实现模型性能基本不变的同时大幅降低计算资源需求。相较于700亿参数的LLaMA3大模型,4bit量化版仅需23.27GB运行显存,每token算力消耗为1.9GFLOPs,仅为LLaMA3-70B的1/80。这一创新使得大模型部署运行更为高效经济。经过评测,在MATH和ARC-C任务中,源2.0-M32量化版性能超越了700亿参数的LLaMA3大模型。目前,该版本已经开源,用户可通过Hugging Face或ModelScope平台下载使用,以探索其在不同领域的应用潜力。
原文链接
本文链接:https://kx.umi6.com/article/5363.html
转载请注明文章出处
相关推荐
换一换
浪潮信息营收新高背后,毛利率下滑至7.6%,海外市场提高171.54%
2024-08-27 17:00:23
浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0
2024-09-21 11:14:27
浪潮信息驶入AI深水区
2025-12-05 16:40:08
WPS笔记正式发布:AI贯穿记录、整理与复用全过程
2026-06-05 18:08:52
AI眼镜卖爆!5月成交额暴涨超200% 大量老外来华强北扫货
2026-06-06 00:24:23
买车要多花6000元!车规存储芯片疯涨180%:全被AI抢走了
2026-06-08 19:42:13
华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”
2026-06-05 19:12:13
NUS 余浩泳教授:外骨骼的轻量化与任务感知丨ICRA 2026
2026-06-03 17:35:24
AI Agent的门票 MiniMax想先打下来
2026-06-04 17:17:31
人类药丸?Anthropic为什么要搞AI不扩散条约
2026-06-07 13:33:45
独家丨华为天才少年王裕鑫创业,首月完成数千万级首轮融资
2026-06-08 12:28:00
CVPR 2026现场直击:CV与机器人的物理结界被彻底打破
2026-06-05 19:24:24
扣子3.0实测:手机就能远程遥控你电脑里的Agent
2026-06-04 09:58:01
754 文章
652008 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41