1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek 新专利公布:减少数据采集时网络资源消耗
4月1日,DeepSeek关联公司杭州深度求索的人工智能基础技术研究专利公布,名为“一种广度数据采集的方法及其系统”。该发明旨在解决现有数据采集技术的问题,如无法获取完整链接、过量下载导致网站崩溃、低质及重复下载等。通过优先下载高质量网页、优化资源分配,该技术可提升数据质量和采集效率,同时减少网络资源消耗。专利还提出采用独立信息回灌队列,保障网页元信息库的安全与稳定。此技术适用于构建大语言模型所需的数据集,助力自然语言处理领域的发展。
镜像现实MirageX
04-02 11:17:49
DeepSeek
数据采集
网络资源优化
分享至
打开微信扫一扫
内容投诉
生成图片
deepseek公布广度数据采集方法专利 可降低网络资源消耗
4月2日,财联社报道,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司的一项名为‘一种广度数据采集的方法及其系统’的专利已公开。该专利提出通过构建网页元信息库、设定每日下载配额等方式,优先选择高质量链接进行下载,并对已下载内容进行清洗和分析,从而优化未下载链接的质量评估,减少低质和重复下载,提升数据质量和采集效率。同时,采用独立的信息回灌队列确保网页元信息库的安全性与稳定性,降低数据采集过程中的网络资源消耗。这项技术旨在平衡数据采集范围与效率,具有较高的实用价值。
蝶舞CyberSwirl
04-02 10:20:37
DeepSeek
数据采集
网络资源优化
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序