1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

正文:
号称地表最强的M3 Ultra,本地跑满血版DeepSeek R1效果如何?已有DeepSeek玩家提前实测。例如Alex老哥,他用两台搭载M3 Ultra的Mac Studio(每台32核CPU、80核GPU、32核神经引擎、512GB统一内存、1TB SSD)通过Thunderbolt 5设备运行完整DeepSeek R1(671B、8-bit),实际速度达11 tokens/秒,理论上可达20 tokens/秒。

相比在线使用DeepSeek R1,在本地运行速度已相当接近。而此前需6-7张A100显卡(约100万元)才能实现类似功能,因此搭载M3 Ultra的Mac Studio被部分网友称为“性价比最高的大模型一体机”。

其他测评显示,B站博主“虽然但是张黑黑”测试中,采用Ollama的GGUF格式速度为15.78 tokens/秒,MLX格式达19.17 tokens/秒。外网博主Xcreate对比M3 Ultra版Mac Studio与M4 Max版MacBook Pro,M3 Ultra在CPU性能上稍优于M4 Max,且在运行DeepSeek R1 70B模型时速度为11.3 tokens/秒,M4 Max为10.69 tokens/秒。

成功运行满血版DeepSeek R1(671B)的关键在于其分片为“专家混合体”,实际运行时切换模型,类似30B规模。不过,有评测显示运行8bit量化版速度为9-21 tokens/秒,4bit量化版为16-18 tokens/秒。

值得注意的是,苹果似乎有意让DeepSeek玩家提前测试M3 Ultra,因其发布时即强调可运行超6000亿参数大模型。此外,网传苹果将在今年WWDC推出M4 Ultra,未来可能更具吸引力。

原文链接
本文链接:https://kx.umi6.com/article/15371.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek降本秘诀曝光:2招极致压榨推理部署,算力全留给内部
2025-07-04 15:46:17
DeepSeek月访问量超ChatGPT
2025-03-31 12:36:49
DeepSeek 新专利公布:减少数据采集时网络资源消耗
2025-04-02 11:17:49
24小时热文
更多
扫一扫体验小程序