
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,大模型竞技场秘密上线名为“steve”的神秘模型,引发广泛关注和猜测。steve在对话中自称来自DeepSeek,但未披露更多身份信息,网友推测其可能是R2、V4或旧版本升级版。steve的知识截止时间为2023年10月,表现参差不齐,虽通过部分智力测试,但在代码生成和复杂任务上逊色于V3和R1。此外,由于R2项目此前多次延期,CEO梁文锋对其表现不满,研发进程或受硬件限制影响。尽管steve真实身份存疑,但外界对其期待不减。参考链接指向相关爆料与讨论。
原文链接
据The Information报道,DeepSeek CEO梁文锋因对R2表现不满意,导致该模型再次推迟发布。此外,研发进程缓慢可能与缺乏英伟达H20芯片有关。R2原计划于4月上线,但至今未有官方消息。此前,DeepSeek在4月发布了一篇关于推理时Scaling Law的论文,并在5月更新了R1版本,引发外界对R2的猜测。尽管网友期待值高涨,但R2仍未正式发布,部分人认为可能需等待V4版本推出。
原文链接
据外媒 The Information 报道,由于美国当局对英伟达 H20 芯片的出口限制,导致 DeepSeek-R2 AI 模型开发进程延迟。DeepSeek 使用了 5 万块 Hopper GPU 训练 R1 模型,其中包括大量 H20 芯片。目前,DeepSeek 团队仍在提升 R2 模型性能,尚未正式投用。此外,H20 芯片供应短缺也影响了现有 DeepSeek-R1 模型的部署。
原文链接
消息称DeepSeek下一代AI模型DeepSeek-R2或将于下周一(3月17日)提前发布,较此前市场预期的5月有所提前。截至发稿,DeepSeek官方尚未对此消息进行回应。财联社3月11日电。(新浪科技)
原文链接
IT之家报道,消息人士称DeepSeek下一代AI模型DeepSeek-R2将于3月17日发布。DeepSeek-R2在编程能力、多语言推理能力和成本效益方面有显著提升。若实现预期,可能在全球AI竞赛中占据优势。此前市场预计其将在5月发布。DeepSeek官方暂未正式公布具体信息。
原文链接
2月26日,幻方量化相关人士就DeepSeek新一代AI模型R2提前发布的消息回应称:“以官方消息为准”。幻方量化于2023年7月成立深度求索AI公司,并于今年1月发布了DeepSeek-R1模型。据路透社报道,知情人士透露DeepSeek正在加速R2模型的发布计划,原定5月发布,现正努力提前。新模型有望生成更优质的代码并支持多语言推理。此外,DeepSeek本月(2月21日)宣布陆续开源5个代码库,每日更新内容。
原文链接
加载更多

暂无内容