#精品
SEO技巧:防止搜索引擎抓取静态资源CDN域名下的网页

2025-01-12 0 554

今天百度了一下813站长大咖,发现百度竟然收录了813站长大咖的CDN域名,这可是SEO大忌。因为同样的内容出现两个域名或多个域名,会被搜索引擎判罚的。基本上所有的搜索引擎都会将多个域名指向同一个页面的结果判定为镜像,被判断为镜像的域名会被降权。

很多WordPress网站用户都会采用CDN,而且CDN域名的回源IP地址与主站是一致的,如果开启了静态缓存,就算用不是WordPress后台设置的站点地址(域名)访问,也是可以访问被缓存了的页面的。因为静态缓存后,前端是不执行PHP的,而是会直接输出HTML。没有开启静态缓存的站点,才会跳转到设置的站点地址。

SEO技巧:防止搜索引擎抓取静态资源CDN域名下的网页
CDN域名被百度收录

如上图,可以看到静态资源的CDN域名被百度收录了。

禁止CDN域名中的非静态资源被搜索引擎抓取

创建robots2.txt文件

用记事本创建一个robots2.txt,加入以下内容,然后上传到网站根目录。

User-agent: *
Allow: /robots.txt
Allow: /*.png*
Allow: /*.jpg*
Allow: /*.jpeg*
Allow: /*.gif*
Allow: /*.bmp*
Allow: /*.ico*
Allow: /*.js*
Allow: /*.css*
Allow: /wp-content/
Disallow: /

通过robots协议,禁止搜索引擎抓取除了.js、.css或图片之外的所有内容。因为是静态资源的CDN域名,所以静态资源还是需要开放抓取的,否则会影响正常收录。

Nginx重定向robots.txt

当然不能够将主域名的robots.txt改成上面那样,那所有页面都不被搜索引擎抓取了。可以利用Nginx的条件判断,指定将robots.txt重定向到robots2.txt的域名。

if ($http_host !~ \"^www.zhanzhangb.com$\") {
	rewrite /robots.txt /robots2.txt last; 
}

以上就是将非www.zhanzhangb.com的域名下的robots.txt重定向到robots2.txt。

if ($http_host ~ \"^cdn.zhanzhangb.com$\") {
	rewrite /robots.txt /robots2.txt last;
}

以上是将cdn.zhanzhangb.com的域名下的robots.txt重定向到robots2.txt。

Apache重定向robots.txt

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www.zhanzhangb.com [NC]
RewriteRule robots.txt robots2.txt [L]

设置完成后,用CDN域名访问一下robots.txt看看是否成功,千万不要将域名对应的robots.txt弄错了,否则会造成重大SEO损失。

收藏 (0) 打赏

感谢您的支持,我会继续努力的!

打开微信扫一扫,即可进行扫码打赏哦,分享从这里开始,精彩与您同在!
点赞 (0)

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。联系邮箱:3496947425@qq.com

813站长大咖 精品文章 SEO技巧:防止搜索引擎抓取静态资源CDN域名下的网页 https://www.813master.cn/1595.html

WordPress极客一枚!无干货,不分享!

常见问题
  • 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。
查看详情
  • 最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug
查看详情

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务