1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

浪潮信息于8月23日发布源2.0-M32大模型的4bit和8bit量化版,该版本旨在通过量化模型精度至int4和int8级别,实现模型性能基本不变的同时大幅降低计算资源需求。相较于700亿参数的LLaMA3大模型,4bit量化版仅需23.27GB运行显存,每token算力消耗为1.9GFLOPs,仅为LLaMA3-70B的1/80。这一创新使得大模型部署运行更为高效经济。经过评测,在MATH和ARC-C任务中,源2.0-M32量化版性能超越了700亿参数的LLaMA3大模型。目前,该版本已经开源,用户可通过Hugging Face或ModelScope平台下载使用,以探索其在不同领域的应用潜力。

原文链接
本文链接:https://kx.umi6.com/article/5363.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0
2024-09-21 11:14:27
浪潮信息营收新高背后,毛利率下滑至7.6%,海外市场提高171.54%
2024-08-27 17:00:23
浪潮信息发布源 2.0-M32 大模型 4bit / 8bit 量化版:运行显存仅需 23GB,号称性能媲美 LLaMA3
2024-08-23 13:13:45
阿里通义 Qwen3-VL 新增 2B、32B 两个密集模型尺寸,手机也能跑
2025-10-22 14:45:02
对冲基金大佬对AI热潮“敬而远之”,更青睐这项技术……
2025-10-23 16:10:22
KTransformers入选计算机系统顶会、与主流框架合作,趋境&清华让「异构」成为推理新范式
2025-10-23 10:01:08
上海开展2025年度中试平台培育储备征集申报工作 涉及集成电路、人工智能等领域
2025-10-22 15:49:20
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
美光出样 192GB SOCAMM2 内存模组:容量提升 50%,能效提升 20+%
2025-10-23 15:09:26
OpenAI也来了,巨头为何决战AI浏览器?
2025-10-23 10:04:31
全球最薄仿生视触觉传感器亮相IROS 2025,一目科技引领机器人“触觉革命”
2025-10-23 15:08:17
LiblibAI融资1.3亿美金,红杉中国、CMC资本等领投
2025-10-23 10:03:33
24小时热文
更多
扫一扫体验小程序