1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:40万的Mac Studio“缝合怪”,双开满血DeepSeek不在话下

几个月前,爱范儿成功在一台M3 Ultra的Mac Studio上部署了671B参数的DeepSeek本地大模型(4-bit量化版)。如果用4台顶配Mac Studio组成“桌面级AI集群”,能否将本地推理性能推向新高度?这是英国创业公司Exo Labs正在探索的问题。

Exo Labs的创始人Alex和Seth来自牛津大学。即使在顶级高校,研究者使用GPU资源也需要提前数月排队,流程繁琐低效。他们发现,当前AI基础设施的高度集中化,让个人研究者和小型团队难以为继。为解决这一问题,他们在去年尝试串联两台MacBook Pro运行LLaMA模型,尽管性能有限,但验证了Apple Silicon架构用于分布式推理的潜力。

今年3月,苹果发布M3 Ultra顶配版Mac Studio,带来512GB统一内存、819GB/s带宽、80核GPU等强大配置,为本地AI集群提供了硬件基础。通过Thunderbolt 5串联4台设备后,系统拥有128核CPU、240个GPU核心、2TB统一内存和超3TB/s总带宽,性能堪比小型超算,却仍保持家用级体积。

关键在于Exo Labs开发的分布式调度平台Exo V2,它能自动拆分模型并分配到最合适的节点。在演示中,Exo V2成功将700GB内存需求的DeepSeek模型拆分到两台Mac Studio上运行,并实现两个670亿参数模型的并行推理。此外,该方案还支持私有文档RAG问答和轻量微调,数据完全本地化,适合企业需求。

相比传统服务器方案,这套系统的成本优势显著。4台Mac Studio高负载运行时功耗仅400W,而同等性能的传统服务器需20张A100显卡,成本超200万人民币,且需独立机房和制冷系统。虽然顶配版售价不菲,但苹果M芯片的统一内存架构带来的高效性,使其成为中小团队的理想选择。

如果说H100是金字塔顶端的王者,那么Mac Studio正成为中小团队手中的瑞士军刀。

原文链接
本文链接:https://kx.umi6.com/article/23270.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
当DeepSeek都认为“DeepSeek向王一博道歉”了
2025-07-04 12:43:36
宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体
2025-04-27 14:16:44
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
2025-07-21 09:13:49
DeepSeek对“王一博案”道歉?假新闻!
2025-07-03 23:32:06
为什么DeepSeek还未能撼动OpenAI
2025-06-04 09:18:31
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
压力给到梁文锋
2025-04-16 22:15:44
罕见千万级大单:山西临汾将打造“AI 医院”,部署 DeepSeek
2025-06-25 17:31:56
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
2025-06-13 16:11:09
你是否也曾榨干过DeepSeek?
2025-04-21 21:54:35
Claude 4六个月内发布!Anthropic联创Kaplan:AGI两三年内到来
2025-05-05 09:37:18
超 346 款生成式 AI 完成备案:DeepSeek 上线 20 天全球日活跃用户即突破 3000 万
2025-07-21 11:16:03
24小时热文
更多
扫一扫体验小程序