互联网思维倡导者
改变烟台SEO优化,网站运营,网络营销现状

菜鸟谈SEO之:搜索引擎的工作原理

以此记录自己在SEO之路上的学习笔记,请各位老师同学多多指正,谢谢!

搜索引擎的工作原理 什么是搜索引擎?
中国目前有400多万个网站,我们不可能一一记住这400多个网站的网址,同时一个网站上也不可能同时提供所有人需要的信息,比如一个提供养殖技术的网站上不会告诉你SEO是什么东西。如果我们想在这400多万个网站中查找一些自己感兴趣的资料,那么这个时候就必须用到一个工具,那就是搜索引擎(Search Engine)。排名世界第一的中文搜索引擎就是百度附:2007年12月全球十大搜索引擎网站 搜索次数(亿次) 市场份额(%)1、谷歌 413.45亿 62.4%2、雅虎 85.05亿 12.8%3、百度 34.28亿 5.2%4、微软 19.40亿 2.9%5、NHN 15.72亿 2.4%6、eBay 14.28亿 2.2%7、时代华纳10.62亿 1.6%8、Ask 7.28亿 1.1%9、Yandex 5.66亿 0.9%10、阿里巴巴 5.31亿 0.8% 搜索引擎是怎样工作的?
随着互联网的蓬勃发展,网站与网站之间的竞争日益激烈,提供相同产品和服务的网站之间为了让搜索引擎这个中间人能将更多的用户带到自己的网站来,从而产生了研究搜索引擎的众多人群,比如百度推广和SEO(搜索引擎优化)。根据百度官方的说法,百度推广是独立的一套系统,当用户在搜索关键词时,搜索引擎给出的答案将会分配给百度推广和自然排名。百度推广我们暂不讨论,而搜索引擎给出的自然排名就和我们息息相关了。如何在搜索引擎的自然排名中有好的排序,是SEO的最终目的,这就使得我们必须仔细,深入的研究搜索引擎到底是如何工作的。
搜索引擎的工作原理是这样的:
抓取——过滤——收录——排序展现结果
一、抓取前面说过,搜索引擎就是个中间人,这个中间人会通过一个自动的抓取程序全天24小时不停歇的将各个网页上的内容进行抓取。(不同搜索引擎的抓取程序名称不同,但是工作原理是相同的,比如百度的抓取程序叫百度蜘蛛Baiduspider,Google的叫Googlebot。)在这里需要注意的是,抓取程序不是什么内容都抓取的,目前的搜索引擎技术能识别的是网页上的文本内容、链接、网页原代码。图片和视频搜索引擎是无法识别的,但是我们可以通过给图片和视频添加文字描述来使抓取程序识别图片和视频,以达到让抓取程序识别的目的。以百度搜索引擎为例,我们可以通过主动向百度搜索引擎提交我们网站的链接来让百度蜘蛛抓取我们的网页内容,也可以等待百度蜘蛛自己找上网站来抓取。影响百度蜘蛛抓取的因素有:1、中文路径,百度蜘蛛程序无法识别。2、路径太长;3、网站根目录robots.txt文件中拒绝百度蜘蛛抓取。如何知道百度蜘蛛有没有来抓取过网站内容呢?可以通过百度站长平台的相关工具进行查询,也可以通过对网站上的服务器日志进行分析。
二、过滤为什么会过滤呢?道理很简单,全中国400多万个网站,不可能每个网站上提供的内容都是有用的。搜索引擎将抓取回来的内容进行筛选,过滤掉那些搜索引擎认为的垃圾信息和对用户无用的信息。过滤后有用的收录,无用的丢掉。还是以百度搜索引擎为例,影响过滤的因素有:1、百度蜘蛛无法识别的内容,无法识别自然会被过滤掉,比如图片和视频;2、网站服务器访问速度,国内服务器响应速度要在100毫秒内,国外服务器在200毫秒内。3、网站的权重,网站权重越高,越会被抓取程序信任;4、页面质量;5、时间因素,SEO就是时间积累的过程,不断完善,不断超越自我的过程。 三、收录注意,被搜索引擎收录不等于就有排名,但是如果没有被搜索引擎收录则肯定不会有排名。搜索引擎会将收录的内容按照一套特定算法进行排序,所以网页上的内容是否被收录对于网站建设者是非常重要的,直接关系到你的网站是否会在用户搜索关键词后有排名。搜索引擎收录的重要知识:1、网站结构,搜索引擎喜欢简洁的树型结构,最好为每个页面都加上导航栏,方便用户返回频道和网站。推荐使用面包屑导航,作用是可以很清晰的告诉访问者目前在网站中的位置以及如何返回。2、使用规范,简单的链接(URL),创建具有良好描述性,规范,简单的URL,网站中同一页面只对应一个URL,而且URL要尽量短。3、在百度搜索框输入SITE:网址,可以查看该网址的收录情况,也可以在进度站长平台的索引量中查看网站的收录情况。4、搜索引擎会收录网站上的什么内容:A、网站标题,B、网页描述,C、关键词,D、网站的原代码,E、网站上的链接(URL)。5、有收录才会有排名,收录率代表着网站的健康度,收录率越高越好。6、收录是一个时间积累的过程,网站和搜索引擎之间,随着时间的积累,信任度不断提升,网站的收录率越高,权重越高。7、修改网站有重大风险。因为搜索引擎讨厌不稳定的网站,如果经常改动上面4中所列的内容,会被搜索引擎视为这个网站极度不稳定,从而降权拒绝收录。从这里我们也可以看出来,SEO其实是一项很系统的工作,需要很强的规划能力,建立网站的时候,网页的结构,原代码,标题,描述,关键词等核心内容就必须提前规划好,而这些内容一但确定就不能随便更改的。 四、排序展现结果当我们在搜索引擎中输入想要寻找的关键字后,可以很明显的看到搜索引擎展现出的页面上关于目标关键词的网站排名。这个结果其实早在搜索引擎收录后就根据自己的一套独特算法进行排序,当有用户搜索的时候就展现给用户。如何获得良好的排序呢?首先,搜索引擎在判断一个网页的内容权重时,网页标题、网页的描述、网页的关键词这三个内容是主要参考信息。其次,一个网站想要有良好的排序,必须有良好的内容建设,也就是给用户提供有价值的,有帮助的内容。《百度SEO优化指南2.0》中建议,想要获得良好的排名,1、提供符合用户需求的原创内容至关重要;2、写好锚文本,也就是链接的描述文字;3、为图片添加alt说明,让搜索引擎了解图片的内容;4、赢得用户对网站的推荐,比如转发,分享,推荐给别的用户。5、准确的描述网页,不要堆砌关键词,为每个网页创建不同的描述,描述的长度合理,不过长,不过短。 抓取网页内容——对抓取到的内容进行筛选过滤——对过滤后的内容进行收录——对收录的内容进行排序,当有用户搜索相关的内容时,搜索引擎给出搜索结果的展现,这就是搜索引擎的整个工作过程。

赞(0) 打赏
未经允许不得转载:泥鳅SEO(张弘宇)博客,烟台SEO,互联网思维学习倡导者 » 菜鸟谈SEO之:搜索引擎的工作原理
分享到: 更多 (0)

评论 1

评论前必须登录!

 

五网合一企业网站建设

联系我们在线客服

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏