1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手
正文:2026年5月,DeepSeek V4系列发布1个月后,官方宣布永久降价,开源社区推出新工具Reasonix,进一步优化成本。Reasonix专为DeepSeek设计,缓存命中率高达99.82%,可将4亿+token的账单从61美元降至12美元,实现2折节省。其核心基于字节稳定prefix-cache设计,通过固定上下文、追加新消息的方式提高缓存效率,并解决工具调用中的JSON问题。Reasonix还提供成本控制策略,默认使用v4 flash模型,复杂任务自动切换至pro版本。安装简单,支持终端和桌面版,但仅适配DeepSeek,不通用。项目引发热议,部分用户分享了类似方案,但Reasonix仍受广泛关注。
AI幻想空间站
05-25 13:32:54
分享至
打开微信扫一扫
内容投诉
生成图片
Redis之父下场,给DeepSeek V4单独造了一台推理引擎
2026年5月,Redis之父Salvatore Sanfilippo(antirez)为DeepSeek V4 Flash打造了一款专属本地推理引擎ds4.c。该引擎基于C+Metal从头编写,专为Apple Silicon优化,不支持其他硬件。通过非对称量化、KV缓存硬盘存储及内置OpenAI和Anthropic API兼容层,ds4.c在Mac上实现了高效推理。测试显示,在128GB内存的M3 Max MacBook Pro上,短prompt生成速度达26.68 token/s。antirez强调,该项目专注于单一模型的极致优化,而非通用性。此项目引发开发者对“一个模型一个推理框架”趋势的讨论。ds4.c开发过程中借助了GPT 5.5辅助,体现了AI协作编程的新模式。
量子思考者
05-08 16:26:08
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V4最大的遗憾
DeepSeek V4最大的遗憾 DeepSeek V4的技术报告中提到了mHC、CSA、HCA、Muon和FP4等技术,但唯独没有Engram。这一缺失引发了广泛讨论。 Engram由DeepSeek与北大于今年1月联合开源,专注于大模型的记忆与效率问题。它的核心理念是为Transform...
AI创想团
05-03 12:19:12
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek不惜代价保住它!V4关键特性被挖出来了
DeepSeek不惜代价保住它!V4关键特性被挖出来了 DeepSeek V4技术报告持续引发关注,一个新发现是,V4为了保留核心设计“batch invariance”(批次不变性),甚至不惜牺牲性能。Batch invariance确保同一token在不同批次组织下输出完全一致,但其实现成本高昂...
神经网络领航员
04-28 15:19:38
分享至
打开微信扫一扫
内容投诉
生成图片
中国信通院正式启动DeepSeek V4国产化适配测试工作
4月27日,中国信通院联合人工智能软硬件协同创新与适配验证中心,正式启动DeepSeek V4国产化适配测试。测试依托工信部重点实验室及AISHPerf基准体系,覆盖芯片、服务器、开发框架等AI软硬件产品。即日起开放报名,诚邀产业链企业参与。此次测评旨在客观评估适配效果,推动模型与硬件协同优化,提升国产软硬件支撑能力,加速构建国产化AI应用生态。
像素宇宙
04-27 15:23:38
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V4永久降价!缓存命中再打1折,实测编程成本骤降83%
2026年4月,DeepSeek V4宣布永久降价,输入缓存命中再打1折,无时限优惠。研究员陈德里确认此为永久政策,并标注AGIforEveryone标签。实测显示,在编程任务中,V4-Pro和V4-Flash的缓存命中率分别达95%和91%,整体成本节省约83%。此前量子位测试3500万token花费31.73元,按新价仅需5.34元。此次降价引发行业震动,惠及学生、初学者及小型企业。DeepSeek通过技术创新持续降低推理成本,预计下半年大规模部署华为算力后或有进一步惊喜。
跨界思维
04-27 13:10:47
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V4报告太详尽了!484天换代之路全公开
2026年4月24日,DeepSeek发布V4版本,历时484天研发。新版本实现百万token上下文全面开源,KV cache缩减至V3.2的10%,显著缓解HBM短缺问题。V4-Pro和V4-Flash分别具备1.6万亿和2840亿参数,上下文长度达1M。模型支持国产芯片华为算力,并预计适配昇腾950超节点。技术亮点包括mHC强化残差连接、混合注意力机制(CSA与HCA交替使用)、Muon优化器替代AdamW等。实验显示,V4-Pro在推理benchmark上优于GPT-5.2,接近Gemini-3.1-Pro;V4-Flash-Max以13B激活参数媲美顶级闭源模型。团队表示未来将探索更精简架构及多模态方向。此次发布强调开源与长期主义,贡献者名单涵盖已离职研究者,彰显团队协作精神。
新智燎原
04-25 12:10:04
分享至
打开微信扫一扫
内容投诉
生成图片
海光信息宣布Day0适配DeepSeek V4
4月24日,深度求索发布并开源DeepSeek V4模型,海光信息同步完成对DeepSeek V4的Day0适配。通过高效闭环模式,海光DCU实现对模型的深度调优,为全球开发者和企业客户提供即取即用的部署方案。此次适配标志着“模型发布—芯片适配—产业落地”的快速推进,助力AI技术产业化应用。
阿达旻
04-24 15:20:44
分享至
打开微信扫一扫
内容投诉
生成图片
昇腾超节点系列产品全面支持DeepSeek V4新模型
4月24日,DeepSeek V4正式发布,昇腾超节点系列产品全面支持该新模型。通过双方芯模技术的紧密协同,昇腾超节点全系列产品已实现对DeepSeek V4系列模型的支持。昇腾950采用融合kernel和多流并行技术,显著降低Attention计算与访存开销,大幅提升推理性能。这一合作展现了技术协同在AI模型优化中的重要作用。(记者 黄心怡)
幻彩逻辑RainbowLogic
04-24 13:15:05
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
2026年4月24日,DeepSeek-V4正式发布并开源,提供两个版本:DeepSeek-V4-Pro对标顶级闭源模型,具备1.6T参数、49B激活及1M上下文长度;DeepSeek-V4-Flash为经济版,参数更小、速度更快。V4-Pro在Agent能力、世界知识和推理性能上领先开源领域,内部使用反馈优于Sonnet 4.5,接近Opus 4.6非思考模式。下半年将批量采用华为算力,API服务同步更新,支持1M上下文标配。此次更新引入全新注意力机制,大幅降低计算需求,并优化了Agent任务适配。DeepSeek-chat和deepseek-reasoner将在三个月后停用,开发者需迁移至新模型。官方强调‘率道而行’,展现技术沉淀与战略布局。
梦境编程师
04-24 13:09:49
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序