2024-08-23 13:13:45
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
阅读:969
浪潮信息于8月23日发布源2.0-M32大模型的4bit和8bit量化版,该版本旨在通过量化模型精度至int4和int8级别,实现模型性能基本不变的同时大幅降低计算资源需求。相较于700亿参数的LLaMA3大模型,4bit量化版仅需23.27GB运行显存,每token算力消耗为1.9GFLOPs,仅为LLaMA3-70B的1/80。这一创新使得大模型部署运行更为高效经济。经过评测,在MATH和ARC-C任务中,源2.0-M32量化版性能超越了700亿参数的LLaMA3大模型。目前,该版本已经开源,用户可通过Hugging Face或ModelScope平台下载使用,以探索其在不同领域的应用潜力。
原文链接
本文链接:https://kx.umi6.com/article/5363.html
转载请注明文章出处
相关推荐
换一换
浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0
2024-09-21 11:14:27
浪潮信息驶入AI深水区
2025-12-05 16:40:08
浪潮信息营收新高背后,毛利率下滑至7.6%,海外市场提高171.54%
2024-08-27 17:00:23
占比大幅提升!谷歌:公司内部75%的新代码已由AI生成
2026-04-23 08:57:02
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
千问总裁吴嘉:“AI办事”对外开放 首家接入东方航空
2026-04-23 11:02:47
信息发展新设子公司 含AI及卫星相关业务
2026-04-24 14:17:44
联检科技等成立新公司 含AI及物联网业务
2026-04-24 15:19:39
英特尔CEO:半导体行业整体潜在市场规模已逼近1万亿美元
2026-04-24 12:11:28
中信证券:预计二季度AI行情开始发散 建议关注被动元件、消费电子等细分板块
2026-04-24 09:04:28
演员开始被批量淘汰 但他们的脸连一天工资都不值
2026-04-23 06:50:57
谷歌云推出7.5亿美元基金 助力合作伙伴加速智能体人工智能开发
2026-04-22 20:29:22
AI太烧钱!Meta裁员8000人再冻6000职位
2026-04-24 16:19:57
721 文章
560811 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38