3月7日,美团搜推机器学习团队宣布开源DeepSeek R1模型的INT8无损量化版本。原模型仅支持英伟达新型GPU,现通过INT8量化,可在A100上部署且吞吐量提升50%。量化代码已合入SGLang框架,模型发布于Hugging Face社区。
原文链接
本文链接:https://kx.umi6.com/article/15020.html
转载请注明文章出处
相关推荐
.png)
换一换
美团终于上线了AI外卖助手
2024-06-07 21:27:04
高通 CEO 安蒙称 DeepSeek R1 模型对高通有利,能直接在本地设备上运行
2025-02-06 17:39:06
“李飞飞团队50美元炼出DeepSeek R1”,如何被曲解了?
2025-02-07 16:04:56
理想同学 App 接入 DeepSeek R1 满血版
2025-02-19 18:53:41
图文并茂:DeepSeek R1 是怎么练成的
2025-02-18 11:11:33
美团发布并开源混合专家模型:5600亿参数 只激活5%就有奇效
2025-09-01 13:18:39
DeepSeek使用技巧,你收藏这一篇就够了
2025-02-07 21:09:11
李飞飞团队50美元训练出DeepSeek R1?
2025-02-06 22:42:33
美团AI编程工具“NoCode”即将上线:让编程“像点外卖一样简单”
2025-05-20 15:49:13
DeepSeek R1遇难题142次”I give up”,研究还称需增加推理时机控制机制
2025-02-14 13:35:29
王兴披露美团 AI 业务进展:基础大模型能力接近 GPT-4o 水平,6 月将推业务决策助手
2025-05-26 21:50:33
昆仑万维天工 AI 上线 DeepSeek R1 + 联网搜索,可优化 R1 偶尔崩溃问题
2025-02-08 17:28:13
美团开源首发 INT8 无损满血版 DeepSeek R1,部署 A100 实现 50% 吞吐提升
2025-03-07 19:05:33
561 文章
259387 浏览
24小时热文
更多

-
2025-10-23 14:07:29
-
2025-10-23 14:06:33
-
2025-10-23 14:05:22