1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软亚洲研究院开源新技术T-MAC,该技术专为优化模型端侧部署而设计,主打性价比,能在CPU上高效部署低比特大语言模型,性能甚至超越NPU/GPU。T-MAC通过基于查找表(LUT)的计算范式,无需反量化操作,直接支持混合精度矩阵乘法,显著提高了推理性能,使模型更加统一和可扩展,尤其适合资源受限的端侧设备。在配备最新高通Snapdragon X Elite芯片组的Surface AI PC上,T-MAC实现了3B BitNet-b1.58模型每秒48个token的生成速率,2bit 7B llama模型每秒30个token,4bit 7B llama模型每秒20个token的生成速率,超越了NPU性能。T-MAC技术现已开源,提供代码和论文链接供进一步研究。 【发布日期】2024年8月

原文链接
本文链接:https://kx.umi6.com/article/4805.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
手机跑大模型提速4-5倍!微软亚研院开源新技术,有CPU就行
2024-08-09 14:49:11
手机跑大模型提速 4-5 倍:微软亚研院开源新技术 T-MAC,有 CPU 就行
2024-08-09 14:08:43
金球奖影后惊呼“我们全完了!” AI女演员正震动好莱坞
2025-10-04 16:02:52
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
英伟达黄仁勋谈 AI 替代就业:会开辟新机遇,人类未来将更“忙碌”
2025-10-03 20:45:15
风投史上首次,报告称 AI 领域年内“吸金”占比过半
2025-10-03 22:46:52
谈“AI抖音”尚早,Sora 2们会先改变影视行业
2025-10-04 09:57:52
华为、阿里押注“超节点”:不卷单卡性能 追求“系统效率”才是国产AI正解?
2025-10-04 09:59:02
亚马逊贝索斯:AI 虽有泡沫但也提供实际价值,太空数据中心有望成为现实
2025-10-04 09:56:37
陶哲轩用GPT-5解决数学难题:仅29行Python代码
2025-10-04 12:59:43
我们为什么对AI失望?
2025-10-03 14:41:09
机器人化身景区“引流利器”!无锡解锁全国首家具身智能体验中心
2025-10-01 18:49:45
盯上AI版抖音的奥特曼,先得搞定皮卡丘
2025-10-02 16:19:49
24小时热文
更多
扫一扫体验小程序