搜索引擎指能够自动从互联网上搜集信息,经过整理以后,提供给用户进行查阅的系统。
搜索引擎的工作原理大致如下:
搜集信息:由于互联网上的数据量非常庞大,搜索引擎的信息搜集基本都是自动完成的。搜索引擎利用被称为网络蜘蛛的自动搜索程序来连上每一个网页上的超链接。从少数几个网页开始,连到数据库上所有到其他网页的链接。
整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎不用重新翻查它所有保存的信息就能迅速找到所要的资料。
接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回信息。搜索引擎能够按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达所需的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。