1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

榨干3000元显卡,跑通千亿级大模型的秘方来了

用几块3000元显卡为主的一体机,就能跑通671B的DeepSeek。这样的场景在过去难以想象,但现在一体机厂商通过采用英特尔锐炫™ 显卡和至强® W处理器,实现了成本大幅降低(10万元以内),同时性能表现出色。

我们亲自测试发现,单人使用时,一体机的速度可达32 tokens/s,处理复杂问题时同样流畅。多人使用时,速度依然保持稳定。即便面对671B的DeepSeek R1,10万元级别的一体机也能达到10 tokens/s,虽稍慢但足够实用。

这套组合拳的关键在于硬件协同与软件优化。锐炫™ 显卡支持多种AI框架,内置XMX AI加速引擎,适合边缘计算;至强® W处理器则具备强大算力和多显卡支持能力。英特尔通过IPEX-LLM、OpenVINO™ 和 oneAPI等工具,让CPU和GPU高效协作,实现性能最大化。

以DeepSeek为例,通过FlashMoE优化,单路至强® W处理器加2-4块锐炫™ A770显卡即可满足企业级需求,提供接近10 Token/s的性能表现。这套方案不仅成本可控,还能灵活部署,满足多种业务场景。

未来,随着大模型推理需求的增长,一体机因其低成本、高效率的优势,将成为企业理想选择。英特尔联合多家伙伴推出的OPEA平台,进一步整合AI工具和应用,为企业提供更完善的解决方案。

“AI无处不在”的故事正在继续,而这一切才刚刚开始。

原文链接
本文链接:https://kx.umi6.com/article/17142.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
2025-06-17 13:23:27
数字人,正在逼近盈利线
2025-07-17 12:20:37
大模型公司挖墙脚哪家强?报告:Anthropic人才吸引力是OpenAI的8倍,留存率达80%
2025-06-05 13:49:32
24小时热文
更多
扫一扫体验小程序