2024-08-23 13:13:45
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
阅读:791
浪潮信息于8月23日发布源2.0-M32大模型的4bit和8bit量化版,该版本旨在通过量化模型精度至int4和int8级别,实现模型性能基本不变的同时大幅降低计算资源需求。相较于700亿参数的LLaMA3大模型,4bit量化版仅需23.27GB运行显存,每token算力消耗为1.9GFLOPs,仅为LLaMA3-70B的1/80。这一创新使得大模型部署运行更为高效经济。经过评测,在MATH和ARC-C任务中,源2.0-M32量化版性能超越了700亿参数的LLaMA3大模型。目前,该版本已经开源,用户可通过Hugging Face或ModelScope平台下载使用,以探索其在不同领域的应用潜力。
原文链接
本文链接:https://kx.umi6.com/article/5363.html
转载请注明文章出处
相关推荐
换一换
浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0
2024-09-21 11:14:27
浪潮信息营收新高背后,毛利率下滑至7.6%,海外市场提高171.54%
2024-08-27 17:00:23
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
2024-08-23 13:13:45
浪潮信息驶入AI深水区
2025-12-05 16:40:08
千问AI眼镜G1现货开售
2026-03-08 10:54:49
只要1分钟!电脑装满血龙虾,现在跟下载APP似的
2026-03-10 11:03:07
因拒绝美军方不受限制地使用其AI模型 美国一科技公司被列入“黑名单”
2026-03-06 20:35:09
三星:考虑与多家AI公司建立合作 押注“多AI模型”手机战略
2026-03-09 20:09:26
中东一场无人机轰炸 把全球智力干倒退了?
2026-03-08 07:42:40
中信证券:看好Micro LED CPO产业趋势,上游芯片环节有望深度受益
2026-03-09 09:25:49
暴雪皮克斯老兵的AI社交实验:用声音匹配,MAU破260万,估值1.5亿美金
2026-03-09 13:39:33
OpenClaw最强外挂出现:小龙虾抓不到数据有救了!
2026-03-08 18:27:06
农业农村部部长韩俊:目前智能采摘机器人、智能灌溉机器人、AI激光除草机器人等已在农业上开始使用
2026-03-09 11:34:34
690 文章
483502 浏览
24小时热文
更多
-
2026-03-10 11:10:02 -
2026-03-10 11:09:29 -
2026-03-10 11:08:54