|
百度提"内容类聚"和"站点类聚"等丰富的特性供用户选择。用户能够控制搜索结果页面的显示风格和显示内容。在显示内容上,除了从百度搜索引擎返回的搜索结果由百度控制外,其它所有内容(包括广告、到其它页面的链接等)都由客户控制。搜索结果的显示方式和内容也可以定制,如网页的属性(标题、摘要、编码类型、日期、长度、URL)、匹配要害字的颜色、不同页之间的链接方式都可以根据客户的喜好决定。
百度从技术上紧密配合实现客户的定制要求。目前百度有三种模式与客户交换搜索结果:
服务应用协议模式(Protocol Model) 该模式采用客户/服务员模式。客户的程序与百度的搜索服务器进行通信,通信协议采用百度定义的BSP(Baidu Search Protocol)。这种方式完全由客户控制结果页面的显示方式,百度只返回检索得到的URL及其属性。这种模式最灵活、客户控制度最高,缺点是实现较为复杂,客户需要一定的编程能力。
服务应用模板模式(Template Model) 用户事先定义好结果页面的显示内容和显示方式,结果页面完全由百度的搜索引擎构造。用户除了处理与用户的Web接口之外,不做任何工作。这种模式的优点是简单、易于实现,缺点是客户可控制度低,模板的变化频率快,灵活性也很差。
服务应用协议模板模式(Protocol Template Model) 这种模式是上述两种模式的结合。客户用显示模板定义结果页面部分内容(往往是检索结果)的显示方式,其余的部分由客户自行决定,整个结果页面的构造由客户完成。检索情况(如有无结果,有无"相关检索"等特性,结果有多少,服务是否正常)的返回遵循百度和客户事先定义好的协议。这种模式既易于实现,又为用户提供了很好的灵活性。
中国人网站采用的是服务应用协议模板模式。中国人网站希望提供一种能够理解自然问句的中文搜索引擎,所以网站需要知道每个查询的检索情况,并做相应处理。假如一个检索有结果,网站便将百度搜索引擎返回的URL和自己的广告整合在一起,显示给用户。假如该查询没有结果,网站便进行切词处理,用处理得到的词构造查询串,再次向百度搜索引擎提交,获得检索结果。
■百度搜索引擎的技术特点
百度搜索引擎具有响应速度快、查找结果准确全面、时效性强、无效链接少、符合中文语言特点和中国人使用习惯等优点。
1、使用智能化的中文语言处理技术
百度搜索引擎使用独特的中文语言处理技术巧妙地解决了中文信息的理解问题,信息索引基于字和词,较好地解决了单纯基于字或单纯基于词的缺点,结合了两者的优点,更加符合中文用户的搜索习惯。百度搜索引擎支持主流的中文编码标准(包括GBK、GB2312、BIG5),并且能够在不同的编码之间转换。
2、使用可扩展的搜索技术
百度搜索使用具有智能性的网络蜘蛛(Spider)自动地在互联网中搜索信息,可定制、高扩展性的调度算法,使得搜索器可在极短的时间内搜集到最大数量的互联网信息,搜集范围涵盖了大部分华语地区和北美、欧洲的部分站点。
3、使用智能的相关度评价算法
百度搜索引擎采用了基于内容和基于链接分析的方法进行相关度评价,能够客观地分析网页所包含的信息,从而最大限度保证检索出的结果与用户查询串有很高的相关性。 4、使用高效的搜索算法
运用多线程等先进技术,高效的搜索算法和稳定的Unix平台,使每个检索的平均响应时间小于1秒。
|
| 共2页: 上一页 [1] 2 下一页 |
评论加载中…