GMI Cloud 上架了基于英伟达H200 GPU的DeepSeek-R1推理模型,该模型参数量达6850亿,支持高达128,000 tokens的上下文长度。DeepSeek此前推出的R1和Janus-Pro模型因其卓越性能和低成本优势,在AI圈引起广泛关注。R1模型成本远低于OpenAI o1,而Janus-Pro在多项基准测试中超越DALL-E 3和Stable Diffusion。GMI Cloud本周启动了限免体验两天的活动,鼓励更多AI企业试用。
原文链接
本文链接:https://kx.umi6.com/article/13126.html
转载请注明文章出处
相关推荐
换一换
deepseek关联公司公布大语言模型部署方法专利
2025-08-01 14:04:10
DeepSeek 出现服务故障:网页 / API 性能异常,已进行修复
2025-11-25 16:59:50
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
微软研报称 DeepSeek 在中国 AI 市场份额达 89%,在白俄罗斯达 56%
2026-01-13 16:44:20
六大AI模型被扔进加密市场厮杀,DeepSeek暂为交易之王
2025-10-20 18:12:39
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
2025-08-20 10:11:16
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
2025-09-29 19:13:01
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
俩人拼出40万的Mac Studio“缝合怪”,双开满血DeepSeek 都不在话下
2025-08-09 11:28:33
不是接入DeepSeek,就叫AI制药
2026-01-17 16:35:32
DeepSeek急招Agent方向!一口气放17个岗位,重度Vibe Coding优先
2026-03-25 15:37:07
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
719 文章
559816 浏览
24小时热文
更多
-
2026-04-24 12:12:33 -
2026-04-24 12:11:28 -
2026-04-24 12:10:22