Google并不索引互联网上的每一个页面;
Google倾向于抛下(或不索引)那些到现在三到六个月以前或更早的页面;
Google倾向于包含blogs、educational以及news and information类站点最新页面(在三个月内创建的页面)中的98%;
Google一般会索引主流媒体站点在最近三个月内创建的页面中的80%;
Google通常会忽略那些信息量很少的某些类型的站点的页面;
在网络上有2,199张包含有"googlology"的页面,Google仅仅列出了624张,而Google声称有655张。Google通常抛下较老的页面,它看上去是选择性的,比如"googlology",3个月、6个月或者更早以前的页面中,仍然有一张或更多的页面被索引,而同时,同期的包含其他该词的其他页面被抛下了。
虽然我们没有非常正规的对该词作研究,但是似乎是在所给的三个月的时期内,第一次包含有"googlology"的页面被Google长期的获留,而同时期的其他包含有"googlology"的页面被逐站的抛下。因此结果是,我们能在Webmaster World找到使用"googlology"的页面,非凡是它第一次使用的页面,但是并不能发现在接下来的10、11、12月中所有的包含 "googlology"的页面。我们能找到Google Village和Microdoc News中包含"googlology"的页面,但并不是所有的情况,在一月到三月这段时间,在Google数据库中,我们站点自己的页面仅出现一次,其他的全部都抡被数据库收进。
用什么描绘来比拟Google搜索引擎是什么样的呢?我们想Google像是一束巨大的搜索的光线,很像地球上看到的太阳的光亮。它的光指向它所作用到的地方,and what else is going on, 例如象互联网上的多数静态部分,Google索引抛下引用到它们那里的引用。静态的意思是,那些页面抡有被更新,或者作任何的变动,也许是没有被个人搜索到。出现在Google的数据库中的,并不意味着它总是在那里。似乎是Google数据库频繁的将一些页面刨除。Google所索引的30亿或更多的页面看上去是互联网上最为重要的30亿个页面。Google所抛下的,是那些抡有被更新或者常被用到的页面,就像我那些六个月以前的老文章。
评论加载中…
![]() |