
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI的GPTBot爬虫导致一家7人团队公司(Triplegangers)网站宕机,使用超600个IP地址抓取数据,引发大量资源消耗和高额费用。Triplegangers拥有最大“人类数字孪生”数据库,包含3D图像及详细标签,吸引OpenAI疯狂抓取。尽管Triplegangers已配置Robot.txt文件并启用Cloudflare,但CEO仍担心数据被盗取。此事件并非孤例,此前已有类似情况发生。AI公司因缺乏高质量数据,加速数据收集,甚至向UP主高价购买未公开视频。截至1月8日,Triplegangers已采取措施防止进一步爬虫。
原文链接
OpenAI的GPTBot爬虫导致一家7人团队公司(Triplegangers)网站宕机,CEO称其堪比DDoS攻击。GPTBot试图下载该公司超过65000种产品的数据,包括数十万张照片及描述。分析显示,OpenAI使用了600多个IP地址进行数据抓取。此举不仅造成网站宕机,还大幅增加了AWS资源消耗。Triplegangers已按要求配置了正确的robots.txt文件,并设置Cloudflare账户防止其他AI爬虫。此事件并非孤例,已有类似情况发生于Game UI Database。AI公司疯狂爬虫的背后原因是缺乏高质量训练数据。
原文链接
加载更多

暂无内容