综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
12月25日,知名工程师Jeff Geerling利用macOS 26.2新特性,将四台M3 Ultra Mac Studio合体,打造出拥有1.5TB统一内存的AI计算集群。关键在于RDMA over Thunderbolt 5技术,使设备间内存直接访问延迟降至50微秒以下。测试显示,该集群在Geekbench 6多核性能中超越同类产品,双精度浮点性能超1TFLOPS,闲置功耗低于10W。AI推理方面,运行Llama 3.2 3B模型每秒处理154.6个token,大型模型Llama 3.1 70B达14.1 token/s,并成功运行DeepSeek R1 671B超大型模型。此外,Qwen3 235B测试中每秒处理31.9 token,DeepSeek V3.1达32.5 token/s。但高负荷下偶有系统崩溃问题。硬件成本约4万美元(约合人民币28万元)。
原文链接
标题:40万的Mac Studio“缝合怪”,双开满血DeepSeek不在话下
几个月前,爱范儿成功在一台M3 Ultra的Mac Studio上部署了671B参数的DeepSeek本地大模型(4-bit量化版)。如果用4台顶配Mac Studio组成“桌面级AI集群”,能否将本地推理性能推向新...
原文链接
加载更多
暂无内容