#精品
中小网站建议屏蔽DataForSeoBot爬虫

2025-01-12 0 1,438

近期813站长大咖通过日志分析发现DataForSeoBot爬虫最近大量抓取本站页面数据,且频次非常高,极大消耗服务器资源。它究竟是个什么来头?通过爬虫附带的URL链接,找到其官网,发现对本站无任何价值所以果断屏蔽。

DataForSeoBot爬虫是什么

许多人会将 DataForSEO Link Bot 视作另一个搜索引擎的网络爬虫。其实不然。

DataForSEO 是通过向世界各地的 SEO 爱好者和专业人士提供高质量的数据来创造公平的竞争环境。

换句话说,就是DataForSeoBot爬虫采集的数据是提供给众多SEO从业人士的,这些数据可以被用作SEO竞争分析、SEO软件开发、市场调查、甚至网络推广等方面。也就是说,对于被抓取的网站本身来说,无任何价值,甚至有数据被采集的负面影响。

如何禁止DataForSeoBot爬虫?

官网宣称DataForSeoBot爬虫支持robots.txt协议,但在百度搜索中发现,有站长吐槽它不太守规矩。所以建议通过同时使用以下两种方式来禁止它。

1、robots.txt方法

User-agent: DataForSeoBot
Disallow: /

2、通过修改Nginx或其它WEB服务器规则禁止抓取

Nginx禁止DataForSeoBot爬虫规则如下:

if ($http_user_agent ~ \"DataForSeoBot/1.0\" )
{
      return 403;
}

另外还可以通过禁止IP访问权限的方式,但IP地址可能会变更,所以不推荐封禁IP。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在!
点赞 (0)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。联系邮箱:3496947425@qq.com

813站长大咖 精品文章 中小网站建议屏蔽DataForSeoBot爬虫 https://www.813master.cn/1555.html

WordPress极客一枚!无干货,不分享!

常见问题
  • 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。
查看详情
  • 最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug
查看详情

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务