
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
据The Information报道,DeepSeek CEO梁文锋因对R2表现不满意,导致该模型再次推迟发布。此外,研发进程缓慢可能与缺乏英伟达H20芯片有关。R2原计划于4月上线,但至今未有官方消息。此前,DeepSeek在4月发布了一篇关于推理时Scaling Law的论文,并在5月更新了R1版本,引发外界对R2的猜测。尽管网友期待值高涨,但R2仍未正式发布,部分人认为可能需等待V4版本推出。
原文链接
标题:草稿链替代思维链,推理token减少80%,显著降低成本和延迟
推理token减少80%-90%,准确率变化不大,某些任务甚至提升。Zoom团队提出“草稿链”,一种思维链替代方案,显著降低延迟和算力成本。草稿链通过生成简洁、信息密集的token简化推理过程,灵感源自人类解题时的简略思考方式。该...
原文链接
据《华盛顿邮报》报道,亚马逊计划于2月26日展示其AI升级版Alexa,但因测试中发现回答不准确问题,该升级版将推迟至3月31日或更晚发布。原计划中,升级版Alexa具备呈现特定性格、记住对话、点外卖及叫车等功能。亚马逊曾预计在数月内完成升级,但至今未实现。此外,苹果Siri的人工智能升级也可能因响应慢、回答生硬等问题推迟至5月推出。
原文链接
英伟达新一代Blackwell GPU被曝存在严重过热问题,导致交付延迟。该处理器专为AI和高性能计算设计,但在高功耗(高达120千瓦)服务器中出现过热现象,影响性能并可能损坏硬件。此问题迫使英伟达多次调整机架设计,进而推迟产品交付。谷歌、Meta和微软等主要客户对能否按计划部署Blackwell服务器表示担忧。英伟达发言人回应称,公司正与云服务提供商紧密合作,通过优化散热系统来解决这一问题。修订后的Blackwell GPU于今年10月底进入量产,预计最早于明年1月底出货。原定于今年第二季度发货的计划因此受到影响。此次技术瓶颈对依赖英伟达GPU进行AI模型训练的科技巨头的研发进度产生显著影响。
原文链接
UBS分析师Timothy Arcuri团队预测,英伟达首批Blackwell芯片可能延迟4至6周发货,预计最早发货时间为2025年1月底。同时,许多客户正转向购买交货时间更短的H200芯片。据估计,首批Blackwell产品将于2025年4月开始使用。台积电已启动Blackwell芯片的生产,但因B100和B200所用的CoWoS-L封装技术较为复杂,导致初期产量低于预期,良率也面临挑战。相比之下,H100和H200采用了CoWoS-S技术。这一消息凸显了英伟达在推出新芯片时面临的供应链挑战及其对市场策略的影响。
原文链接
本文探讨了IT系统中的延迟问题,从1纳秒到2天,涵盖了CPU、内存、网络、硬盘等组件的响应时间。作者强调了理解延迟指标对性能优化和产品设计的重要性,指出即使在现代技术中,光速限制等因素决定了某些延迟的理论最低值。例如,北京到广州的延迟受物理距离影响,不可能低于6毫秒。文章介绍了不同延迟级别下的典型活动,如CPU的20纳秒以下、内存读写和网络操作的微秒级,以及广域网通信的毫秒至秒级延迟。最后,作者提醒在产品设计和性能需求设定时,需考虑这些延迟因素。本文摘自公众号“云算计”,作者曹亚孟。
原文链接
加载更多

暂无内容