1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:PyTorch架构优化库torchao正式发布,AI模型效率提升显著 新闻摘要: PyTorch新版本下的架构优化库torchao于10月2日正式推出,专为提升AI模型的效率而设计。torchao提供了一系列工具,专注于模型的量化和稀疏性优化,旨在在保持性能的同时降低计算成本和RAM使用量。通过支持float8和int4等低精度数据类型,torchao能有效减少硬件开销和RAM用量。 在预训练方面,torchao的float8训练流程使得LLaMA 3 70B模型的计算速度提升1.5倍。开发者只需通过convert_to_float8_training函数即可将模型训练转换为float8,实现高效训练。对于推理,torchao提供了权重量化(Weight-Only Quantization)和动态激活量化(Dynamic Activation Quantization)等多种量化方法,用户可根据需求选择最合适的策略以优化模型性能。 在稀疏性优化上,torchao能够提高模型参数计算效率,使ViT-H模型的推理速度提升5%。此外,torchao还支持权重量化为int4,以及键值缓存量化为int8,这使得LLaMA 3.1 8B在完整128K上下文长度下的内存使用量降至18.9GB。torchao的发布为AI模型的运行效率带来了显著提升,值得AI领域的开发人员关注并应用。

原文链接
本文链接:https://kx.umi6.com/article/7004.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
昔日王者TensorFlow,已死
2025-09-15 10:52:07
PyTorch团队首发技术路线图,近百页文档披露2024下半年发展方向
2024-07-15 16:26:35
PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率
2024-10-09 09:47:39
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
2025-03-05 14:04:44
Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?
2024-09-06 12:54:27
OpenAI公司正为印度用户提供为期一年的免费ChatGPT Go服务
2025-10-28 14:53:35
AI推理创企Fireworks AI融资2.5亿美元 估值达40亿美元
2025-10-28 21:07:35
艾伦・图灵研究所启动新任务,保护英国免受网络攻击
2025-10-29 13:51:48
美国参议员提出“GUARD”法案,拟禁止未成年人使用 AI 聊天机器人
2025-10-29 10:49:16
芯片行业再迎利好?黄仁勋预告:本周访韩期间将宣布重大消息
2025-10-29 12:53:23
青岛人工智能产业创新中心公司注册成立 经营范围包括人工智能基础软件开发等
2025-10-28 10:50:55
奥尔特曼:OpenAI 明年 9 月将胜任“实习研究助理”,力争比人类更快取得新发现
2025-10-29 08:39:14
剑指核聚变与攻克癌症!美政府将与AMD联手打造两台超级计算机
2025-10-28 10:46:25
24小时热文
更多
扫一扫体验小程序