网站镜像的一些知识
发布日期:2019-08-19 浏览次数:1080 关键词:网站镜像
怎样发现自己网站被镜像了?
有时候注意到自己网站被镜像了是因为自己网站排名下降,怀疑有人负面SEO,有时候是搜索品牌名称,看到镜像网站。已经知道自己被镜像了好办,直接看下面怎么处理部分。
很多站长则完全不知道自己网站是否被镜像了。有几个我常用的检查方法:
一是百度统计后台,受访域名部分列出了使用相同百度统计代码的域名。其中出现快照、百度/谷歌翻译等是正常的,但出现一些奇奇怪怪的域名就要查看一下了,比如访问一下就知道都是镜像SEO每天一帖,引诱用户赌博的网站,然后站长把SEO每天一帖的统计代码也照抄过去了。
看看上面列出的小偷出现功能就知道,其实统计代码很容易替换或删除的,所以在受访域名只能看到一小部分镜像网站。
第二是搜索网站的特征句子,最容易想到的是网站品牌名称、首页标题等,确实可以发现一些镜像网站。但如前所述,品牌名绝大多数是会被替换的,所以我更喜欢搜索一些页面上的特征句子,比如本博客最上面的副标题:睿网信息的SEO博客,优化网站关键词。
网站被镜像了怎么办?
首先,一些网上提到的解决办法并没有什么用,比如有的说页面上的链接用绝对地址有帮助,其实小偷程序都会自动替换网址,用相对地址还是绝对地址没什么差别。 还有的说页面上加上网站链接、网站名称、版权声明之类的,搜索引擎会识别哪个是正版。
但镜像小偷程序连链接带文字都可以全部自动替换,这么做并没有用,发现镜像网站后的处理原则就是让镜像网站不能在镜像域名上显示你的内容。考虑到镜像网站是要实时访问和调用被镜像的页面的,所以可以考虑几个方法:
比如用JS检测一下正在被打开的页面是不是在自己的域名上,是的话正常显示,不是的话(域名是镜像网站时)强迫转向到自己域名: if (window.location.hostname !== ‘www.runideas.com.cn’){ window.top.location.href = ‘https://www.runideas.com.cn/’; }
(声明:上面代码只是简单举例) 不过这种方法只对用户有效,搜索引擎不执行JS,还是会抓取到镜像内容,可以用PHP写脚本判断和转向。
把对方主机IP先屏蔽了,不过镜像网站来实时抓取用的IP大部分情况下不是域名主机IP,可能是CDN,可能是伪造IP,也可能是多IP的服务器。要发现必须屏蔽的IP,需要查看网站原始日志。