4月1日,DeepSeek关联公司杭州深度求索的人工智能基础技术研究专利公布,名为“一种广度数据采集的方法及其系统”。该发明旨在解决现有数据采集技术的问题,如无法获取完整链接、过量下载导致网站崩溃、低质及重复下载等。通过优先下载高质量网页、优化资源分配,该技术可提升数据质量和采集效率,同时减少网络资源消耗。专利还提出采用独立信息回灌队列,保障网页元信息库的安全与稳定。此技术适用于构建大语言模型所需的数据集,助力自然语言处理领域的发展。
原文链接
本文链接:https://kx.umi6.com/article/16613.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek们越来越聪明,却也越来越不听话了
2025-05-20 22:46:53
为什么DeepSeek回答前总先“嗯”一下
2025-04-30 20:17:08
万字长文总结:DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live
2025-03-31 16:42:05
427 文章
61098 浏览
24小时热文
更多

-
2025-07-19 22:57:32
-
2025-07-19 21:58:20
-
2025-07-19 21:57:13