1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:40万的Mac Studio“缝合怪”,双开满血DeepSeek不在话下

几个月前,爱范儿成功在一台M3 Ultra的Mac Studio上部署了671B参数的DeepSeek本地大模型(4-bit量化版)。如果用4台顶配Mac Studio组成“桌面级AI集群”,能否将本地推理性能推向新高度?这是英国创业公司Exo Labs正在探索的问题。

Exo Labs的创始人Alex和Seth来自牛津大学。即使在顶级高校,研究者使用GPU资源也需要提前数月排队,流程繁琐低效。他们发现,当前AI基础设施的高度集中化,让个人研究者和小型团队难以为继。为解决这一问题,他们在去年尝试串联两台MacBook Pro运行LLaMA模型,尽管性能有限,但验证了Apple Silicon架构用于分布式推理的潜力。

今年3月,苹果发布M3 Ultra顶配版Mac Studio,带来512GB统一内存、819GB/s带宽、80核GPU等强大配置,为本地AI集群提供了硬件基础。通过Thunderbolt 5串联4台设备后,系统拥有128核CPU、240个GPU核心、2TB统一内存和超3TB/s总带宽,性能堪比小型超算,却仍保持家用级体积。

关键在于Exo Labs开发的分布式调度平台Exo V2,它能自动拆分模型并分配到最合适的节点。在演示中,Exo V2成功将700GB内存需求的DeepSeek模型拆分到两台Mac Studio上运行,并实现两个670亿参数模型的并行推理。此外,该方案还支持私有文档RAG问答和轻量微调,数据完全本地化,适合企业需求。

相比传统服务器方案,这套系统的成本优势显著。4台Mac Studio高负载运行时功耗仅400W,而同等性能的传统服务器需20张A100显卡,成本超200万人民币,且需独立机房和制冷系统。虽然顶配版售价不菲,但苹果M芯片的统一内存架构带来的高效性,使其成为中小团队的理想选择。

如果说H100是金字塔顶端的王者,那么Mac Studio正成为中小团队手中的瑞士军刀。

原文链接
本文链接:https://kx.umi6.com/article/23270.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
德国要求苹果与谷歌下架DeepSeek应用 中方已多次明确表态
2025-06-28 12:19:15
梁文锋代表DeepSeek,他代表梁文锋
2025-11-16 12:31:32
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
2025-07-21 21:22:47
大模型退火之后,AI手机还好吗
2025-06-25 08:26:26
在史上最大规模WAIC中寻找DeepSeek
2025-07-28 09:10:59
DeepSeek成了硅谷最大的“不能说的秘密”
2025-09-23 17:20:46
DeepSeek线上模型版本升级至V3.1
2025-08-19 20:04:27
DeepSeek真的不行了吗
2025-07-29 19:35:17
DeepSeek发布两款新模型
2025-12-01 19:31:03
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
郑州:深化与DeepSeek等人工智能头部企业的合作
2025-06-24 20:22:15
24小时热文
更多
扫一扫体验小程序