1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:40万的Mac Studio“缝合怪”,双开满血DeepSeek不在话下

几个月前,爱范儿成功在一台M3 Ultra的Mac Studio上部署了671B参数的DeepSeek本地大模型(4-bit量化版)。如果用4台顶配Mac Studio组成“桌面级AI集群”,能否将本地推理性能推向新高度?这是英国创业公司Exo Labs正在探索的问题。

Exo Labs的创始人Alex和Seth来自牛津大学。即使在顶级高校,研究者使用GPU资源也需要提前数月排队,流程繁琐低效。他们发现,当前AI基础设施的高度集中化,让个人研究者和小型团队难以为继。为解决这一问题,他们在去年尝试串联两台MacBook Pro运行LLaMA模型,尽管性能有限,但验证了Apple Silicon架构用于分布式推理的潜力。

今年3月,苹果发布M3 Ultra顶配版Mac Studio,带来512GB统一内存、819GB/s带宽、80核GPU等强大配置,为本地AI集群提供了硬件基础。通过Thunderbolt 5串联4台设备后,系统拥有128核CPU、240个GPU核心、2TB统一内存和超3TB/s总带宽,性能堪比小型超算,却仍保持家用级体积。

关键在于Exo Labs开发的分布式调度平台Exo V2,它能自动拆分模型并分配到最合适的节点。在演示中,Exo V2成功将700GB内存需求的DeepSeek模型拆分到两台Mac Studio上运行,并实现两个670亿参数模型的并行推理。此外,该方案还支持私有文档RAG问答和轻量微调,数据完全本地化,适合企业需求。

相比传统服务器方案,这套系统的成本优势显著。4台Mac Studio高负载运行时功耗仅400W,而同等性能的传统服务器需20张A100显卡,成本超200万人民币,且需独立机房和制冷系统。虽然顶配版售价不菲,但苹果M芯片的统一内存架构带来的高效性,使其成为中小团队的理想选择。

如果说H100是金字塔顶端的王者,那么Mac Studio正成为中小团队手中的瑞士军刀。

原文链接
本文链接:https://kx.umi6.com/article/23270.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
梁文锋,Nature全球年度十大科学人物!
2025-12-09 10:25:17
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
全球 6 大顶级 AI 实盘厮杀,Deepseek 三天收益爆赚 36% 傲视群雄
2025-10-22 08:40:07
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
DeepSeek 输入缓存降价
2026-04-26 23:42:34
deepseek当选网易有道词典2025年度词汇,全年搜索量超867万次
2025-12-01 18:22:41
DeepSeek发布梁文锋署名新论文 开源相关记忆模块Engram
2026-01-13 09:25:44
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先
2026-03-25 15:37:07
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
24小时热文
更多
扫一扫体验小程序