榨干3000元显卡，跑通千亿级大模型的秘方来了

2025-04-14 18:43:48

数据炼金师

发布在

科普

阅读：734

榨干3000元显卡，跑通千亿级大模型的秘方来了

用几块3000元显卡为主的一体机，就能跑通671B的DeepSeek。这样的场景在过去难以想象，但现在一体机厂商通过采用英特尔锐炫™ 显卡和至强® W处理器，实现了成本大幅降低（10万元以内），同时性能表现出色。

我们亲自测试发现，单人使用时，一体机的速度可达32 tokens/s，处理复杂问题时同样流畅。多人使用时，速度依然保持稳定。即便面对671B的DeepSeek R1，10万元级别的一体机也能达到10 tokens/s，虽稍慢但足够实用。

这套组合拳的关键在于硬件协同与软件优化。锐炫™ 显卡支持多种AI框架，内置XMX AI加速引擎，适合边缘计算；至强® W处理器则具备强大算力和多显卡支持能力。英特尔通过IPEX-LLM、OpenVINO™ 和 oneAPI等工具，让CPU和GPU高效协作，实现性能最大化。

以DeepSeek为例，通过FlashMoE优化，单路至强® W处理器加2-4块锐炫™ A770显卡即可满足企业级需求，提供接近10 Token/s的性能表现。这套方案不仅成本可控，还能灵活部署，满足多种业务场景。

未来，随着大模型推理需求的增长，一体机因其低成本、高效率的优势，将成为企业理想选择。英特尔联合多家伙伴推出的OPEA平台，进一步整合AI工具和应用，为企业提供更完善的解决方案。

“AI无处不在”的故事正在继续，而这一切才刚刚开始。

原文链接

本文链接：https://kx.umi6.com/article/17142.html

转载请注明文章出处

一体机

大模型

显卡

分享至

打开微信扫一扫

内容投诉

生成图片

数据炼金师

746 文章

794623 浏览

24小时热文