10月17日,EXO Labs展示了一项名为“分布式推理”的新成果,通过结合苹果M3 Ultra Mac Studio和两台英伟达DGX Spark设备,在AI推理测试中实现2.8倍性能提升。该方案基于开源项目EXO,可将大语言模型的工作负载分配至不同硬件,形成类似WiFi Mesh的“AI Mesh”网络。测试显示,DGX Spark在计算密集型预填充阶段快3.8倍,而Mac Studio在带宽敏感的解码阶段快3.4倍,两者互补显著优化性能。EXO框架目前为早期版本,计划引入更多功能,但仍属研究工具。这一创新表明,未来AI算力扩展可通过智能硬件协同实现,而非依赖单一设备。
原文链接
本文链接:https://kx.umi6.com/article/26805.html
转载请注明文章出处
相关推荐
换一换
AI性能大幅提升!曝苹果A18芯片基于Arm最新V9架构
2024-09-07 21:12:33
PPTV创始人姚欣AI再创业,“分布式推理”终于有人做了
2024-09-11 13:26:02
我全都要:苹果 M3 Ultra Mac Studio 叠加双英伟达 DGX Spark,AI 性能提升 2.8 倍
2025-10-17 02:05:38
阴和俊:在量子科技等领域布局建设未来产业 加强对国家重大科技任务和科技型企业的金融支持
2025-12-08 10:23:04
甘肃庆阳智算规模达10万P
2025-12-08 16:38:29
广西“十五五”规划建议:积极发展股权、债券等直接融资 支持上市公司提质
2025-12-07 10:25:53
山东省“十五五”规划建议:加快机器人和智能装备推广应用 打造低空经济发展集聚区、内河新能源船舶制造基地
2025-12-08 09:21:09
工信部召开务虚会 研究谋划“十五五”及开局之年工作
2025-12-07 15:35:49
抖音副总裁李亮:AI 手机助手本质是“机主”授权,与入侵、黑客、隐私无关
2025-12-08 21:48:42
用AI图仅退款,这批羊毛党把商家薅麻了
2025-12-08 12:24:10
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
央视起底 AI 带娃现象,专家称沉迷或阻碍低龄儿童认知发育
2025-12-06 16:37:45
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
572 文章
376078 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57