百度现在变换规则非常快,机制也越来越完善,很多昨天还有排名的站点,今天却没有了,很多昨天没排名的站,今天就出现在首页了,让很多做站的站长感觉很是头大,以前做SEO都是根据百度的规律来进行,而现在百度的变化完全让SEO的同胞们摸不着头脑,其实这也不难,仔细分析IIS日志,依然会发现很多规律的,做为一个新站的建设者,我就拿自己的网站来举例说明如何分析IIS日志中蜘蛛爬行的状况。
建议大家在上线之前之前一定要禁止百度蜘蛛爬行的,因为要做很多站内的检测,对百度蜘蛛开放之前一定要做好检查,一定要检查死链,很多做站的都是用的别人的程序,这里面就肯定存在很多软件的链接,该改的一定要修改完,当你确实认为站点没有问题了,那就可以对百度蜘蛛进行放行了。我的站是4月1日才上线的,在此之前进行了半个月的调试,


大家可以看这个图。在4月1号的时候蜘蛛就来得非常多了,这里有必要讲解下蜘蛛的一些具体IP分析,很多人肯定有疑问,你怎么知道是百度蜘蛛呢?这方面其实多在网上找下资料,你就能发现很多方面相关的,当然很多都是转载的,并不是很完善。我结合我的站的日志给大家详细讲解下蜘蛛的IP。
根据不同的IP我们可以分析网站是个怎样的状态.下面就按照我IIS日记上的百度蜘蛛IP为例:
123.125.68.*这个蜘蛛经常来,别的来的少,表示网站可能要进入沙盒了,或被者降权。
220.181.68.*每天这个IP 段只增不减很有可能进沙盒或K站。
220.181.7.*、123.125.66.* 代表百度蜘蛛IP造访,准备抓取你东西。
121.14.89.*这个ip段作为度过新站考察期。
203.208.60.*这个ip段出现在新站及站点有不正常现象后。
210.72.225.*这个ip段不间断巡逻各站。
125.90.88.* 广东茂名市电信也属于百度蜘蛛IP 主要造成成分,是新上线站较多,还有使用过站长工具,或SEO综合检测造成的。
220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,基本来说你的网站会天天隔夜快照,绝对错不了的,我保证。
220.181.108.92 同上98%抓取首页,可能还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页基本24小时放出来。
123.125.71.106 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。
220.181.108.91属于综合的,主要抓取首页和内页或其他,属于权重IP 段,爬过的文章或首页基本24小时放出来。
220.181.108.75重点抓取更新文章的内页达到90%,8%抓取首页,2%其他。权重IP 段,爬过的文章或首页基本24小时放出来。
220.181.108.86专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
123.125.71.95 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。
123.125.71.97 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。
220.181.108.89专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
220.181.108.94专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
220.181.108.97专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
220.181.108.80专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
220.181.108.77 专用抓首页IP 权重段,一般返回代码是304 0 0 代表未更新。
123.125.71.117 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。
220.181.108.83专用抓取首页IP 权重段,一般返回代码是304 0 0 代表未更新。
注:以上IP尾数还有很多,但段位一样的123.125.71.*段IP 代表抓取内页收录的权重比较低.可能由于你采集文章或拼文章暂时被收录但不
放出来.(意思也就是说待定)。
220.181.108.*段IP主要是抓取首页占80%,内页占30%,这此爬过的文章或首页,绝对24小时内放出来和隔夜快照的,这点我可以保证!
一般成功抓取返回代码都是200 0 0返回304 0 0代表网站没更新,蜘蛛来过,如果是200 0 64别担心这不是K站,可能是网站是动态的,
所以返回就是这个代码。
大家仔细看这些IP。再结合我站点内的图可以仔细看下是否也存在这些IP段呢,做站必须养成良好的查询日志的习惯,这样你才能找到站的问题,也才能有的放矢,我在4月1日进行的放蜘蛛行为,而站点在4月4日就有很不错的排名,绵阳富乐网,富乐网均排在了第一位,这和我每天关注IIS日志分不开的。大家可以看下如下的图:



综上所述,大家在做站的时候一定要经常去看IIS日志,要分析问题,比如我的站就有很多404的错误,我到现在也还在找原因。

文章点评