DeepSeek V4 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

破天荒！DeepSeek V4正式版居然要涨价，而且翻着倍地涨

【DeepSeek V4正式版7月上线，高峰时段API价格首次翻倍】一向以“价格屠夫”著称的DeepSeek破天荒宣布涨价！官方邮件显示，DeepSeek V4正式版将于7月上线，并在高峰时段（UTC 1:00-4:00及6:00-10:00）将API输入与输出token价格翻倍，非高峰时段则维持原价。此次调价折射出其算力紧张，近期DeepSeek正加速在乌兰察布自建数据中心并大量招募算力基建人才。尽管涨价，其底价仍具竞争力。官方承诺正式版将带来性能提升，开发者们期待此次更新能改善预览版幻觉率高、长上下文不稳定及代码处理欠佳等问题，并呼吁加入原生多模态功能。

原文链接

电子诗篇

06-30 12:18:51

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

正文：2026年5月，DeepSeek V4系列发布1个月后，官方宣布永久降价，开源社区推出新工具Reasonix，进一步优化成本。Reasonix专为DeepSeek设计，缓存命中率高达99.82%，可将4亿+token的账单从61美元降至12美元，实现2折节省。其核心基于字节稳定prefix-cache设计，通过固定上下文、追加新消息的方式提高缓存效率，并解决工具调用中的JSON问题。Reasonix还提供成本控制策略，默认使用v4 flash模型，复杂任务自动切换至pro版本。安装简单，支持终端和桌面版，但仅适配DeepSeek，不通用。项目引发热议，部分用户分享了类似方案，但Reasonix仍受广泛关注。

原文链接

AI幻想空间站

05-25 13:32:54

分享至

打开微信扫一扫

内容投诉

生成图片

Redis之父下场，给DeepSeek V4单独造了一台推理引擎

2026年5月，Redis之父Salvatore Sanfilippo（antirez）为DeepSeek V4 Flash打造了一款专属本地推理引擎ds4.c。该引擎基于C+Metal从头编写，专为Apple Silicon优化，不支持其他硬件。通过非对称量化、KV缓存硬盘存储及内置OpenAI和Anthropic API兼容层，ds4.c在Mac上实现了高效推理。测试显示，在128GB内存的M3 Max MacBook Pro上，短prompt生成速度达26.68 token/s。antirez强调，该项目专注于单一模型的极致优化，而非通用性。此项目引发开发者对“一个模型一个推理框架”趋势的讨论。ds4.c开发过程中借助了GPT 5.5辅助，体现了AI协作编程的新模式。

原文链接

量子思考者

05-08 16:26:08

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V4最大的遗憾

DeepSeek V4最大的遗憾 DeepSeek V4的技术报告中提到了mHC、CSA、HCA、Muon和FP4等技术，但唯独没有Engram。这一缺失引发了广泛讨论。 Engram由DeepSeek与北大于今年1月联合开源，专注于大模型的记忆与效率问题。它的核心理念是为Transform...

原文链接

AI创想团

05-03 12:19:12

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek不惜代价保住它！V4关键特性被挖出来了

DeepSeek不惜代价保住它！V4关键特性被挖出来了 DeepSeek V4技术报告持续引发关注，一个新发现是，V4为了保留核心设计“batch invariance”（批次不变性），甚至不惜牺牲性能。Batch invariance确保同一token在不同批次组织下输出完全一致，但其实现成本高昂...

原文链接

神经网络领航员

04-28 15:19:38

分享至

打开微信扫一扫

内容投诉

生成图片

中国信通院正式启动DeepSeek V4国产化适配测试工作

4月27日，中国信通院联合人工智能软硬件协同创新与适配验证中心，正式启动DeepSeek V4国产化适配测试。测试依托工信部重点实验室及AISHPerf基准体系，覆盖芯片、服务器、开发框架等AI软硬件产品。即日起开放报名，诚邀产业链企业参与。此次测评旨在客观评估适配效果，推动模型与硬件协同优化，提升国产软硬件支撑能力，加速构建国产化AI应用生态。

原文链接

像素宇宙

04-27 15:23:38

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V4永久降价！缓存命中再打1折，实测编程成本骤降83%

2026年4月，DeepSeek V4宣布永久降价，输入缓存命中再打1折，无时限优惠。研究员陈德里确认此为永久政策，并标注AGIforEveryone标签。实测显示，在编程任务中，V4-Pro和V4-Flash的缓存命中率分别达95%和91%，整体成本节省约83%。此前量子位测试3500万token花费31.73元，按新价仅需5.34元。此次降价引发行业震动，惠及学生、初学者及小型企业。DeepSeek通过技术创新持续降低推理成本，预计下半年大规模部署华为算力后或有进一步惊喜。

原文链接

跨界思维

04-27 13:10:47

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V4报告太详尽了！484天换代之路全公开

2026年4月24日，DeepSeek发布V4版本，历时484天研发。新版本实现百万token上下文全面开源，KV cache缩减至V3.2的10%，显著缓解HBM短缺问题。V4-Pro和V4-Flash分别具备1.6万亿和2840亿参数，上下文长度达1M。模型支持国产芯片华为算力，并预计适配昇腾950超节点。技术亮点包括mHC强化残差连接、混合注意力机制（CSA与HCA交替使用）、Muon优化器替代AdamW等。实验显示，V4-Pro在推理benchmark上优于GPT-5.2，接近Gemini-3.1-Pro；V4-Flash-Max以13B激活参数媲美顶级闭源模型。团队表示未来将探索更精简架构及多模态方向。此次发布强调开源与长期主义，贡献者名单涵盖已离职研究者，彰显团队协作精神。

原文链接

新智燎原

04-25 12:10:04

分享至

打开微信扫一扫

内容投诉

生成图片

海光信息宣布Day0适配DeepSeek V4

4月24日，深度求索发布并开源DeepSeek V4模型，海光信息同步完成对DeepSeek V4的Day0适配。通过高效闭环模式，海光DCU实现对模型的深度调优，为全球开发者和企业客户提供即取即用的部署方案。此次适配标志着“模型发布—芯片适配—产业落地”的快速推进，助力AI技术产业化应用。

原文链接

阿达旻

04-24 15:20:44

分享至

打开微信扫一扫

内容投诉

生成图片

昇腾超节点系列产品全面支持DeepSeek V4新模型

4月24日，DeepSeek V4正式发布，昇腾超节点系列产品全面支持该新模型。通过双方芯模技术的紧密协同，昇腾超节点全系列产品已实现对DeepSeek V4系列模型的支持。昇腾950采用融合kernel和多流并行技术，显著降低Attention计算与访存开销，大幅提升推理性能。这一合作展现了技术协同在AI模型优化中的重要作用。（记者黄心怡）

原文链接