锐客网

搜索引擎蜘蛛爬行规律探秘(二)外链是否有时效性

发表日期:2018-11-10 作者:小锐 浏览次数:

我在博客中国的博客(可能是因为流量超标在2016年被删除了)早就已经被删了,但是百度依然有快照。今天看了下首页的快照已经没有了,但是文章页面还存在。看快照日期可以看到是2006年,甚至更久的。也就是虽然页面被删除了有5年之久,但是百度的快照没有删除,那么你说这里面的链接蜘蛛会不会爬呢?我感觉应该是会爬的,而且我在博客网的这个博客是有一个域名A的链接的,当时只是做了个跳转到博客首页。后来在我启用域名A做博客的时候,立马就获得了一个很好的权重,而且文章很容易被秒收。相信这个5年前的链接起到了不少的作用。

第二,如果外链所在页面搜索引擎没有了快照,外链是否有效呢?答案可能会出乎很多人的意料,外链所在页面没有了快照依然还可以有效。原因可以查看我在蜘蛛如何抓取链接这篇文章里写的,蜘蛛抓取页面之后,会把内容和链接分开,链接也就是URL会加入一个网址索引库,而蜘蛛爬行是从这个网址索引库出发的。先看证据,这个证据来自于谷歌站长工具:这个截屏来自于Google站长工具故障诊断的404报告,以前我在原网站下面架设了个bbs,当然早在N年前已经删除了。可是这个不存在的页面,被Google蜘蛛抓取的来源地址竟然也是不存在的页面。而用Google搜索,是没有这些页面的快照的(如下图)。那是不是意味着已经404了很久的页面上的导出链接依然有效?

第三,那么外链对于搜索引擎是否有时效性呢?

很明显应该是有时效性的。那么我就猜测一下外链失效的原因吧,应该会有两个原因:那就是外链所在页面被删或者链接被删。

1.针对页面被删的情况,搜索引擎应该会继续爬行这个页面上的外链,直到这个页面404一定时间后,会给搜索引擎网址索引库一个命令删除这个外链。

2.而对于页面更改的情况,搜索引擎应该也会爬行这个外链,直到这个含有这个外链快照在搜索引擎内部彻底删除,会给网址索引库一个命令删除这个外链。因为含有外链的页面根据情况会保存N个时期的快照,这就是为什么有时候搜不同的词,网页的快照不同。

如没特殊注明,文章均为锐客网原创,转载请注明来自  https://www.wangzhan500.com/news/3003.html

锐客网客服

锐客网咨询热线 咨询热线

13798391694

0755-23772759

在线咨询
锐客网微信扫码咨询

微信扫码咨询

锐客网QQ咨询 QQ咨询 锐客网QQ咨询 邮件咨询
返回顶部 返回顶部