1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:PyTorch架构优化库torchao正式发布,AI模型效率提升显著 新闻摘要: PyTorch新版本下的架构优化库torchao于10月2日正式推出,专为提升AI模型的效率而设计。torchao提供了一系列工具,专注于模型的量化和稀疏性优化,旨在在保持性能的同时降低计算成本和RAM使用量。通过支持float8和int4等低精度数据类型,torchao能有效减少硬件开销和RAM用量。 在预训练方面,torchao的float8训练流程使得LLaMA 3 70B模型的计算速度提升1.5倍。开发者只需通过convert_to_float8_training函数即可将模型训练转换为float8,实现高效训练。对于推理,torchao提供了权重量化(Weight-Only Quantization)和动态激活量化(Dynamic Activation Quantization)等多种量化方法,用户可根据需求选择最合适的策略以优化模型性能。 在稀疏性优化上,torchao能够提高模型参数计算效率,使ViT-H模型的推理速度提升5%。此外,torchao还支持权重量化为int4,以及键值缓存量化为int8,这使得LLaMA 3.1 8B在完整128K上下文长度下的内存使用量降至18.9GB。torchao的发布为AI模型的运行效率带来了显著提升,值得AI领域的开发人员关注并应用。

原文链接
本文链接:https://kx.umi6.com/article/7004.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Fireworks乔琳:AI产品上市时间从五年压缩到五天,我们的秘诀是什么?
2024-09-06 12:54:27
昔日王者TensorFlow,已死
2025-09-15 10:52:07
PyTorch 灵魂人物 Horace He 从 Meta 出走,选择 OpenAI 前 CTO 初创公司
2025-03-05 14:04:44
PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率
2024-10-09 09:47:39
PyTorch团队首发技术路线图,近百页文档披露2024下半年发展方向
2024-07-15 16:26:35
汇丰:阿里巴巴千问更新是消费级AI应用方面的“重要一步” 维持“买入”评级
2026-01-16 17:50:35
Meta一边挥刀赶走老白兔,一边改绩效发甜枣
2026-01-16 15:46:56
微软谷歌正在大力招「电工」
2026-01-16 16:45:05
千问App接入淘宝、闪购!全球首发AI购物功能
2026-01-15 11:40:37
营销牵引、算力筑基,浙文互联引领大模型时代营销
2026-01-16 09:26:53
英伟达悄然修改技术论文错误表述 大幅下调数据中心铜使用量
2026-01-16 11:37:08
全球首个机器人租赁平台“擎天租”完成种子轮融资,高瓴创投领投
2026-01-15 17:49:55
交通运输部部长刘伟:抓住卫星互联网发展机遇 推动人工智能在交通运输领域规模化创新应用
2026-01-16 20:55:41
24小时热文
更多
扫一扫体验小程序