k1体育3915十年品牌什么是搜索引擎及搜索引擎工作原理
k1体育十年品牌我们平常用来搜索的百度就是中国最大的搜索引擎,其它还有雅虎、新浪等推出的搜索引擎,不过量小得多,一般只有百分之几。那搜索引擎有没有科学的定义呢。
一般说来,搜索引擎是指以一定的策略搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。
也有人把互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站,这种基于目录的检索服务网站成为搜索引擎,但从严格意义上,它并不是搜索引擎。
抓取网页一般称为网络机器人,其实是一个网页抓取程序,英语叫spider。它是怎么工作的呢。
Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,从理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
抓取网页后,还必须进行处理,处理内容包括四个方面,其中最重要的就是提取关键词,建立索引文件,其次还得去除重复网页、分析网页中的超链接、计算网页的重要度。
这一技术还在不断发展中,这就是为什么大家有时假输入的关键词却找不到想要的内容,这就是收索引擎处理网页时精度不高造成的。
处理网页后,就是与我们直接相关的检索服务了,我们输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;一般情况下为了用户便于判断,除提供网页标题和URL外,还会提供一段网页摘要及其他信息。