
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2月26日,幻方量化相关人士就DeepSeek新一代AI模型R2提前发布的消息回应称:“以官方消息为准”。幻方量化于2023年7月成立深度求索AI公司,并于今年1月发布了DeepSeek-R1模型。据路透社报道,知情人士透露DeepSeek正在加速R2模型的发布计划,原定5月发布,现正努力提前。新模型有望生成更优质的代码并支持多语言推理。此外,DeepSeek本月(2月21日)宣布陆续开源5个代码库,每日更新内容。
原文链接
标题:英伟达面临强劲对手:DeepSeek-V3
神秘的东方力量再次震惊世界,这次是大模型。12月26日,幻方量化旗下的DeepSeek发布新一代开源大模型DeepSeek-V3,该模型参数量高达671B,仅用2048块GPU训练2个月,总成本557.6万美元。这意味着DeepSeek-V3的训练成...
原文链接
【科技前沿】知名私募幻方量化旗下大模型厂商深度求索(DeepSeek)于今日宣布,合并其明星产品DeepSeek Coder V2和DeepSeek V2 Chat模型,升级推出全新版本DeepSeek V2.5。这一动作标志着深度求索在人工智能领域的持续创新与技术进步,为行业注入了新的活力。作为此次升级的核心亮点,DeepSeek V2.5模型旨在提升代码生成与对话交互的智能水平,为企业及开发者提供更高效、精准的解决方案。随着这一重大更新的发布,市场对深度求索未来的发展充满期待,预示着人工智能技术在实际应用中的潜力将进一步被挖掘。
原文链接
【2023年2月2日】私募巨头幻方量化旗下新组织"深度求索"宣布采用上下文硬盘缓存技术,旨在优化大模型API的使用效率。该技术将预估需重复使用的数据存储于分布式硬盘阵列,以减少不必要的计算过程。在具体应用中,当输入内容重复时,只需从缓存中读取,无需重新计算,此举有望使大模型成本降低一个数量级。目前,缓存命中部分的费用设定为每百万tokens 0.1元。这一创新策略不仅提高了大模型的运行效率,也为降低成本开辟了新路径。
原文链接
加载更多

暂无内容