标题:DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
正文:
号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1效果如何?已有DeepSeek玩家提前实测。例如Alex老哥,他用两台搭载M3 Ultra的Mac Studio(每台32核CPU、80核GPU、32核神经引擎、512GB统一内存、1TB SSD)通过Thunderbolt 5设备运行完整DeepSeek R1(671B、8-bit),实际速度达11 tokens/秒,理论上可达20 tokens/秒。
相比在线使用DeepSeek R1,在本地运行速度已相当接近。而此前需6-7张A100显卡(约100万元)才能实现类似功能,因此搭载M3 Ultra的Mac Studio被部分网友称为“性价比最高的大模型一体机”。
其他测评显示,B站博主“虽然但是张黑黑”测试中,采用Ollama的GGUF格式速度为15.78 tokens/秒,MLX格式达19.17 tokens/秒。外网博主Xcreate对比M3 Ultra版Mac Studio与M4 Max版MacBook Pro,M3 Ultra在CPU性能上稍优于M4 Max,且在运行DeepSeek R1 70B模型时速度为11.3 tokens/秒,M4 Max为10.69 tokens/秒。
成功运行满血版DeepSeek R1(671B)的关键在于其分片为“专家混合体”,实际运行时切换模型,类似30B规模。不过,有评测显示运行8bit量化版速度为9-21 tokens/秒,4bit量化版为16-18 tokens/秒。
值得注意的是,苹果似乎有意让DeepSeek玩家提前测试M3 Ultra,因其发布时即强调可运行超6000亿参数大模型。此外,网传苹果将在今年WWDC推出M4 Ultra,未来可能更具吸引力。
.png)

-
2025-07-21 12:18:20
-
2025-07-21 12:17:10
-
2025-07-21 11:21:54