4月2日,财联社报道,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司的一项名为‘一种广度数据采集的方法及其系统’的专利已公开。该专利提出通过构建网页元信息库、设定每日下载配额等方式,优先选择高质量链接进行下载,并对已下载内容进行清洗和分析,从而优化未下载链接的质量评估,减少低质和重复下载,提升数据质量和采集效率。同时,采用独立的信息回灌队列确保网页元信息库的安全性与稳定性,降低数据采集过程中的网络资源消耗。这项技术旨在平衡数据采集范围与效率,具有较高的实用价值。
原文链接
本文链接:https://kx.umi6.com/article/16611.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek月访问量超ChatGPT
2025-03-31 12:36:49
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
2025-04-30 20:23:36
426 文章
80076 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13