淘宝搜索引擎鉴别方法 搜索引擎的分类?

[更新]
·
·
分类:互联网
3873 阅读

淘宝搜索引擎鉴别方法

搜索引擎的分类?

搜索引擎的分类?

搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如google、AltaVista、Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。需要说明的是,这些信息并不是搜索引擎即时从互联网上检索得到的,通常所说的搜索引擎,其实是一个收集了大量网站/网页资料并按照一定规则建立索引的在线数据库,如2004年3月底google收录的网页数量已经超过42亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。
另一类称为分类目录,这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。yahoo是分类目录的典型代表,国内的搜狐、新浪等搜索引擎也是从分类目录发展起来的。分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。

搜索引擎、网络爬虫、浏览器的区别是什么?

可以这样简单的理解搜索引擎主要有两部分一部分是推荐系统「切词,权重,排名」另一部分是爬虫。在服务器端通过爬虫收集网站数据,进行分析建立索引。用户搜索时对关键词进行分析,检索爬取的内容反馈给用户。
爬虫是通过访问网站获取需要的数据。
浏览器是一个客户端,主要作用是解析渲染html ,前端脚本JS或者flash等。

搜索引擎可分为哪两种类型,各有什么特点?

分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎。特点如下:
1、全文搜索引擎
这种搜索方式方便、简捷,并容易获得所有相关信息;利用爬虫程序抓取互联网上所有相关文章予以索引;但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。
2、元搜索引擎
基于多个搜索引擎结果并对之整合处理的二次搜索方式;元搜索引擎适用于广泛、准确地收集信息;有利于各基本搜索引擎间的优势互补;有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。
3、垂直搜索引擎
对某一特定行业内数据进行快速检索的一种专业搜索方式;适用于有明确搜索意图情况下进行检索,以准确、迅速获得相关信息。
4、目录搜索引擎
依赖人工收集处理数据并置于分类目录链接下的搜索方式;对网站内信息整合处理并分目录呈现给用户;目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。