4月1日,DeepSeek关联公司杭州深度求索的人工智能基础技术研究专利公布,名为“一种广度数据采集的方法及其系统”。该发明旨在解决现有数据采集技术的问题,如无法获取完整链接、过量下载导致网站崩溃、低质及重复下载等。通过优先下载高质量网页、优化资源分配,该技术可提升数据质量和采集效率,同时减少网络资源消耗。专利还提出采用独立信息回灌队列,保障网页元信息库的安全与稳定。此技术适用于构建大语言模型所需的数据集,助力自然语言处理领域的发展。
原文链接
本文链接:https://kx.umi6.com/article/16613.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
当DeepSeek都认为“DeepSeek向王一博道歉”了
2025-07-04 12:43:36
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
被曝蒸馏DeepSeek还造假!欧版OpenAI塌方了
2025-08-14 16:57:45
梁文锋等来及时雨
2025-07-15 17:50:04
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
2025-09-22 21:02:17
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
2025-09-01 18:24:35
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
2025-07-21 21:22:47
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
2025-08-19 21:05:45
527 文章
239754 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20