SEM团队巨作-GOOGLE搜索引擎蜘蛛的等级《精华中之精华》
★ GOOGLE搜索引擎蜘蛛的等级:
首先先谈下GOOGLE蜘蛛起源:
当GOOGLE搜索引擎刚建立之初,就拥有这一个非常强大的的服务器,
其每天放出大量的蜘蛛,我们称为1号蜘蛛,其抓取量抓取速度是非常的快,
对其整个互联网每天进行信息进行的采集,可见服务器的速度是多少快,其实最主要的是后期GOOGLE
将服务器延伸到了很多城市,所以现在你能发现GOOGLE的运算速率是超前的快.
服务器将采集的信息分类,整理.到庞大的数据库.
其中有个数据库都是用来存网站域名的.
域名只要被搜索引擎索引到,将自动存入此数据库.
此数据库是1号蜘蛛的核心.
其内部分为10个PR各等级的小数据库,虽说小数据库,但也是大的可怕-。=!
10个等级的数据库 其周期也不同
基本上以一个PR=4的网站来讲 1号蜘蛛爬行的概率也在7天一次.
所以基本你也会发现收录有大的幅度也是在7天内的某一天 .
细心的站长会发现其实有时候7天还是蛮准的,但只针对PR=4
越是PR高其周期越是短,越是PR低周期越长,
当然说到这很多站长有这样的疑惑.会觉得蜘蛛有时天天收录他的站
这里对其收录的也就是接下来要说的2号蜘蛛
2号蜘蛛往往是在1号蜘蛛爬行过程中放出去的,
主要针对于被1号蜘蛛爬过的网站的外部链接.
PS既然都说是2号蜘蛛 肯定其抓取力度要比1号小很多.
★ 当然不只是有2号,还有3号蜘蛛
所谓3号也就 A站1号蜘蛛爬行到B站,B站的2号蜘蛛爬行到C站
目前GOOGLE为了限制其无限的循环对于蜘蛛只分为这三个等级.并对其等级的抓取率有个很明确的标准
而且2号与3号蜘蛛有个抓取特点 基本以时间的先后顺序进行抓取
★ 比方讲:
A网站被1号蜘蛛爬行后的一篇文章最后时间为 2008-6-1
那当A网站被从别的网站过来的2号蜘蛛给爬行,首先有可能会对其收录的是
最近发表的几篇文章如: 2008-5-31等 2008-5-30等文章将会进行第2次,第3次的访问
之后再爬行2008-6-1以后的信息.如果你网站没有任何更新,它将对其近一个月内的更改内容进行2次爬行.
如果外部来的2号与3号蜘蛛越多,同一篇文章有可能会被爬上好几次.
以下为GOOGLE提供的官方数据<秘>
★ 1号蜘蛛
基本抓取率在5%~10%
基于PR=0 没有任何导入链接与提交时 有可能被抓取的周期在6个月~12个月不等
基于PR=1 没有任何导入链接与提交时 有可能每次被抓取的周期在4个月~8个月不等
基于PR=2 没有任何导入链接与提交时 有可能被抓取的周期在2个月~4个月不等
基于PR=3 没有任何导入链接与提交时 有可能被抓取的周期在1个月~2个月不等
基于PR=4 没有任何导入链接与提交时 有可能被抓区的周期在1周~1个月不等
当然没有任何导入链接的网站无法做到PR=4
最高也只有PR=3
上述此数据只是GOOGLE官方提供的一个基数.
意思也就是1号蜘蛛主动爬取你网站的周期数.
对于2号或者3号蛛爬取你的网站,也就根据你的导入链接而定.
所以你会发现你的网站有时天天在被更新.
★ 2号蜘蛛
基本抓取率是2.5%~5%<基于1号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>
★ 3号蜘蛛
基本抓取率为1.25%~2.5%<基于1号蜘蛛与2号蜘蛛爬行后的数据记录进行再次采集,对于最后次被采集日期的前后进行再次访问>
GOOGLE目前蜘蛛的等级分为三种
当然蜘蛛有不同的蜘蛛
这里单单只的是网页蜘蛛.因为我只对这个感兴趣.
西域SEM团队 研究小组敬上!
- 每周百度搜索引擎更新周期
- Google的搜索引擎排名(SEO)优化策略
- 经得住时间检验的外部链接
- 交换外部链接别迷信PR值
- 使用Google网站优化工具提高网站的转换率
- 哪些网站不适宜做相关性友情链接
- 交换外部链接别迷信PR值
- Google搜索引擎开始索引Flash文件
- Matt Cutts专谈外部链接建设
- SEM(搜索引擎营销)涉及的网络广告术语
中文关键字:华中 巨作 蜘蛛 团队 等级 搜索引擎 精华 google sem 周期 网站 链接 基于 数据库 对于 基本 当然 再次 服务器 数据 pr 篇文章 所以 越是 最后 敬上 2008 信息 西域 外部
你还可能感兴趣的相关文章
小胖 is
Email this author | All posts by 小胖