访客亚马逊分类目录数据统计: 收录网站1526个,待审站点594个,分类目录69个,入驻会员250位,发布资讯21
当前位置:亚马逊分类目录 » 站长资讯 » 收录资讯 » 文章详细

分类目录式搜索引擎有哪些

时间:2020-03-29      浏览:3162次      来源:本站原创


分类目录式搜索引擎有哪些

网页的分类过程分为自动、人工2种,信息的分类是一个非常繁琐的工作,通常一个分类目录式搜索引擎一般要采集数亿个网页,用户查询时,通过逐级层层浏览这些类目,寻找自己所需的网址信息。这类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是维护量大、需要人工等。

国外具有代表性的分类目录搜索引擎有:Yahoo、Open Directory、LookSmart、60 Guide等。国内具有代表性的目录搜索引擎有:新浪、搜狐、中文雅虎等。

垂直搜索引擎系统包括搜集子系统、索引子系统 和检索子系统三个组成部分。垂直搜索引擎的结构根据搜索引擎设计的复杂度不同,搜索引擎的设计框架也不一样,简单的基于查询串的搜索引擎如AltaVista等,只包含2部分的功能: 搜索与查询服务。复杂的搜索引擎提供目录服务以及其他的内 容。根据常用的搜索结构,将分类目录式搜索引擎和基于查询串的搜索引擎结合起来,设计了一个垂直搜索引擎的体系结构,其各部分功能简述如下: 

l、爬虫软件:俗称spider,或robot等,定向搜索各类信息前数名的网站,并负责将这些Web文档搜集到原始数据库中。 

2、索引器:索引是检索的有利工具,好的索引机制会导致检索效率的提升。索引器负责对原始数据库的文档构造索引,并且存储在索引数据库中。

3、检索器:检索器利用索引数据库中的索引来查找与用户查询相匹配的文档,计算各个文档和查询关键词的相关度,并将相关度大于阈值的文档按照相关度递减的顺序排列,反馈给访客。索引器是垂直搜索引擎的核心。

4、用户接口:一般来说,在输出界面中,垂直搜索引擎将检索结果展示为一个线形的文档列表,提供可视化的查询输入和结果输出界面,其中包含了文档的标题和超链等信息。