搜索引擎搜索结果从输入到结果输出的展现,需要经过四个步骤:抓取、过滤、索引收录、结果展现。
一、抓取
1、蜘蛛通过有指向性的urll链接、外部链接、提交链接等方式进行访问抓取,蜘蛛会对抓取过的内容页面进行记录并根据对用户的重要程度来进行不同频 率的抓取更新。
2、对设置了权限和进行了不友好设置得页面不抓取。
3、抓取方式分为深度抓取和广度抓取
深度抓取就是以树型结构形式从上到下的纵深抓取
广度抓取就是以地毯搜索形式展开平铺以面的方式抓取
二、过滤
蜘蛛会对空白页面、低值页面、死链接、不友好页面、对用户不存在价值的页面进行过滤、排斥,保留有价值和符合规则的优质页面。
三、索引收录
蜘蛛会对抓取回的内容数据根据页面优劣情况进行标识、储存,同时将三大标签中的关键词信息进行标识、储存,便于更好的匹配用户的搜索展现。
四、结果展现
通过对用户的关键词搜索,搜索引擎按照关键词的需求在索引数据库中寻找最符号用户的数据,并根据页面的优劣情况展现给用户。
搜索引擎, 搜索结果, 工作原理, 记录
评论前必须登录!
注册