0

搜索引擎排名计算原理

已有23人阅读此文 - - 搜索引擎 - sbf胜博发

为什么需要了解搜索引擎原理?因为知道搜索引擎怎么工作,才知道怎么去做排名。我们在《什么是搜索引擎》文章具体介绍了几个常见的搜索引擎:比如百度、谷歌、360搜索等,为了迎合它们会涉及到搜索引擎的工作原理。

搜索引擎排名计算原理

搜索引擎工作原理图

我们在使用百度的时候,我们点击相关的关键词,弹出的页面经常会有个排序。那么如果我们了解到它的工作原理,我们就可以有相关的策略,让我们自己运营的网站排名更加靠前一点,当用户点击相关的关键词的时候,点击我们这个网站的几率就会大大增加。

首先了解一下搜索引擎工作流程:

抓取网页----过滤----收录---排名----展现

我们了解了搜索引擎的工作排名计算流程,就知道怎么去优化我们的网页,怎么去更新我们的网站内容,而不是盲目的往我们的网站里填充一些垃圾信息!

原理是什么呢

爬虫机制

所以今天就给大家简单介绍一下这些搜索引擎的工作原理。其实它是这样的,在事先搜索引擎它会派出一个类似于叫爬虫的这样一个工具。就像我这个展示的蜘蛛人,他会爬呀爬呀爬,他有意识的去搜索分析一些相关的网站,然后进行自己的一个网站存储,他会把这个网站的内容进行梳理, 然后提取,把这个文本内容提取成若干个词库,那词库里都包含了相应的很多关键词。然后就对这些关键词进行分析,假如说我们其中某一个网页,它的文章里边有智能手机或者是手机助手,那么就给它分成若干个小词段以便于用户搜索。然而因为这个爬虫的程序,他是在不定期的来进行收取这个相关的网站的,那么就会导致这样一个现象。在进行搜索的时候,可能同一个网站被他扒了两次,那么它就需要去除这样重复的一个一个数据,保留唯一的一个。最后就是对这个网站的内容进行分析之后,把相关的词全列在一起,与之对应的这个词出现的网页链接地址是什么,都做好相应的排列。假如说我想搜手机,那么就有几个网页会弹出手机相关的内容,然后我就可以点相关的网页进行查看了。这就是是爬虫,建立一个索引这样的一个机制。

用户体验,链接分析,内容相关性

搜索引擎的原理除了上面说的爬虫索引机制,还与用户体验,链接分析,内容相关性有关,这是怎么理解呢?刚才只是说爬虫他去搜集文章,然后建立一个这样的索引,紧接着它会进行一个比较,比较的是什么呢?比较的是内容相关性,很多网站进行比较,这个网站跟用户想要的输入的关键词,他想要的内容是否相关。另外一个是链接分析这个网站是否足够的精简,链接里是否也包含了与关键词相关的字段,这也是链接分析的其中的一个方法。然后就是用户的体验,他会对用户搜索一个关键词,谈出的结果进行一个反馈的。假如说用户搜索手机,弹出很多页面,那么它会进行相应的汇总,把用户点击率高的网页排名靠前,这也是搜索引擎在进行不断的分析的时候,根据用户的体验来做了一个综合的排名。那么其实在这三个部分的过程中,就会有很多网站进行作弊,例如说在一个文章中,同一个关键词出现的频率过多,这时它的词频超过了,那其实这也是一个作弊的方式。这样的话就会有一个反作弊的程序来对内容相关性,链接分析,用户体验中可能的作弊行为进行干预,有的时候是人工的,有的时候是机器智能的。

查询分析、缓存机制、综合排名

接下来就包含了三个部分。首先搜索引擎会对用户所查询的关键词进行分词处理,根据用户的地理位置和历史检索特征来进行用户需求的分析,他是一个自动的分析过程,以便使用地域性搜索结果和个性化搜索结果,展示用户最需要的内容,这是查询的分析。

另外我们说到了搜索引擎它会建立很多的这样的一个缓存机制,是包含了不同的词对应的相关的页面。缓存中是否有该关键词的查询结果,如果有就是最快的呈现查询的结果。我们会发现有的时候我们在百度上搜索,如果一些比较热门的词就会弹出的很快,假如说我们搜索一个比较冷门的,或者是最近刚刚发生这样的词,搜索引擎可能就没有建立这种的这样的一个缓存的资料,那么弹出的页面可能就会很慢。相应就会在这个搜索库中的网页进行调取排名呈现,并将该关键词和对应的搜索结果加入到缓存中,他同样会把这个词再加进这个缓存中,以便于别人在搜索的时候,它的速度会更加快的。

另外一个就是网页排名,根据用户搜索这个词和搜索的需求,刚才我们前面说到搜索的分析,还有缓存,接下来这个就是在分析还有缓存的基础之上,对索引库中的网页进行相关性、重要性和用户体验的高低进行分析最终从中选择较好的推荐给用户。其实它还是包含了一个综合性的概念,用户在搜索结果中点击和重复搜索行为也可以告诉搜索引擎,因为你再点击一个网页的时候,这些数据会自动反馈给搜索引擎,它会知道你最需要最想看的是哪个网页,这也会对网页它的排名有一定的影响的。那么我们就看到了这样一个整体的搜索引擎工作原理,其实主要包含两部分,一个是爬虫的爬取,然后建立索引。另外一个是根据用户的需求和用户的体验来进行相关的页面的排名。

影响搜索引擎工作原理因素

影响抓取的因素:

中文路径和路径过长也不能识别,路径注意伪静态利于搜索引擎。怎么优化路径请点击查看:网站url路径优化。

影响过滤因素:

1、识别。蜘蛛无法识别网页的图片和flash ,所以一篇文章的质量高低就看文字的丰富度,对文章的图片一定要做优化,则无法识别。点击查看文章:文章图片优化

2、网站权重。也就是我们网站的信任度,网站权重越高,信任度就越高,收录就越快!

3、页面质量。页面内容质量越高越容易收录。

4、时间问题。老站的页面新站收录更快!


更多>>评论

发表