2006-12-09

Alexa排名内幕调查报告

来源: 本站收集整理 作者: 评论 0 条
 

  据小林推测,Alexa可能在全球不同地方设置了一些采样机,通过与一些电信机构进行或明或暗的合作,甚至在临近电信网关的节点进行网络嗅探,得到一些“弥补性”的采样数据。而寻求这些采样数据的目的恰恰是为了照料Alexa所认为的“工具条低安装率”地区的抽样成效。打个比方,假如Alexa认为韩国互联网已经特别普及,而韩国用户却一直没有安装Alexa工具条的习惯,它就可能会设法在韩国安插一些采样机,以弥补在韩国用工具条采样的不足。一样的情形,也可能导致香港在刚刚设置采样机时网站排名的猛增。而经过一段时间的考察,Alexa就会逐步调整在每个地区的采样数量,以得到它所认为的最合理的结果。

  甚至小林还认为,今年内地网站排名的大规模提升也有采样机在作怪,而国庆后内地网站排名的普遍下降也许就是因为Alexa在经过一年的考察后,重新调整了在中国内地采样比重的结果。

  当然,Alexa要维护其排名的权威性和公正性,不仅要完善流量数据的采样过程,更要在预防作弊方面做出庞大努力,那些防作弊的技术也都是Alexa的不宣之秘。那么Alexa到底是用什么办法来预防作弊呢?事实上,对于前文中记者提到的以编程模拟Alexa工具条返回数据包的作弊方式,Alexa几乎没什么好办法去防范,甚至要探测到这样的作弊手段都比较难。

  其实,对于现在网上常见的作弊手段,Alexa都已经有了足够的免疫力。一样来说,由于现在多数搜索引擎都无法处置JS脚本,所以针对搜索引擎的作弊往往都是用JS脚本编写恶意代码来实现,而Alexa和Google采用的爬行程序则是眼前仅有的可识别JS脚本的此类程序。

  小林在对几个大型网站的流量监测中发觉,Alexa启用了一个叫做IA_Archiver的机器人程序,这个机器人程序类似Google等搜索引擎使用的蜘蛛程序,专门在互联网上爬行,刺探每个Web页面的流量信息。尤其是当某个网站的流量超过Alexa设定的阈值时,IA_Archiver就会立刻爬到该网站的服务器上,分析此网站的流量是否平常,有没有作弊行为。据小林对IA_Archiver的监测,该机器人程序已经可以识别大部分基于网站服务器端的流量作弊行为。但现在业内对IA_Archiver的认知普遍不足,记者也只是在Alexa网站的一个帮助页面上看到有关IA_Archiver机器人程序的简单介绍,而国内知道这个机器人程序的人不多,更缺乏相关的技术钻研。

  信任Alexa?

  针对Alexa排名的可信度,不同的人有不同的看法,从事Web技术钻研与应用的业内人士多倾向于这样一个说法:Alexa排名不一定是绝对正确的,但却是相对可信的。下面记者举出的一些例子,将从不同方面对Alexa排名的可信度进行对比。

  必须承认,尽管Alexa用很多技术手段提高了网站流量监测数据的有效性,但由于其固有的一些技术上的瑕疵,难免使少数网站的排名结果出现一些问题,尽管这些问题在很大程度上要归咎于网站域名结构的不合理性。

  比如,Alexa排名是针对URL地址的,并没有考虑IP地址的因素,这在很大程度上降低了Alexa排名计算的难度,但是也不可避免地产生了偏差。一样而言,Alexa只对二级域名感爱好,而针对三级域名的流量都被纳入了上一级域名的统计,对于比较规范的大型网站而言,这是完全正确的策略,但是对于一个向不同用户分发了三级域名的网站来说,它的流量统计是否应该将所有的子用户的流量加起来呢?这显然要因情形而异,一个很明显的此类不合理统计的例子就是cninfo.net,相信国内老网民都还记得这个域名后缀,这是全国各省市公众信息港通用的二级域名,比如,sh.cninfo.net和gd.cninfo.net分别是上海和广东的两个网站,而Alexa则将其统一算做www.cninfo.net的子域。于是,www.cninfo.net就成了简体中文网站排名第40多位的网站,尽管它其实根本就不是一个可以访问的网站。
共6页: 上一页 [1] [2] [3] [4] 5 [6] 下一页

(本文仅表明作者个人观点,不代表本站及其管理员立场.) 推荐 收藏 投稿 打印 返回 关闭
上一篇:Alexa排名研究与分析实战  
下一篇:Alexa作弊大解密
    评论加载中…

网站首页  -  网站地图 -   站长论坛  -  网站投稿  -    -  网站管理
Copyright © 2008 芜湖站长站 All Rights Reserved 皖ICP备07500611号