用户通过搜索引擎查询某个关键词,可能这个过程仅仅用了2秒钟,但是对于搜索引擎来讲,可不是那么简单的一个过程。那么就有盛世阳光小编通过下图来演绎一下搜索引擎是如果反馈给我们结果的。
类似百度和谷歌搜索引擎,首先要建立一个庞大的数据库。建立数据库的关键就是Spider,就是我们通常说的蜘蛛、机器人,这是整个工作的开端,只有被Spider抓到的网页才有机会被搜索到。
其次,搜索引擎将抓到的网页进行分析处理:链接抽离、内容处理、消除噪声、提取主题和关键词、文本内容分析等,
第三就是对网页文本内容进行分词处理,消除停止词等;
第四步是进行去重处理,就是判断该文章在库中是否存在,如果存在就会被剔除。这就是要做原创文章的重要行了。
经过以上四步,网页内容、链接地址、关键词等就会进入索引库,等待用户查询。
那么用户查询某一个关键词,又是什么流程呢?
首先搜索引擎会对查询的内容进行分词处理,得知客户最想要的是什么内容;
第二根据用户所在的地理位置和历史检索特点进行需求分析,力争给你最好的结果;
第三给出用户结果又分为两种情况,要么用户查询的关键词在缓存中存在,要么不存在,存在的直接输出给用户,如果不存在,需要进入索引库,通过索引库再写入缓存中。
作为一个优秀的搜索引擎,给出客户的结果一定是最合适的结果,如何作答最优答案呢?那就需要搜索引擎有一个排名规则,下面我们就看一下搜索引擎排名规则。
当网页内容进入搜索引擎的索引库之后,搜索引擎会对输出的页面进行排序。
首先搜索引擎会分析用户查询关键词和被查询网页的内容的相关性;
其次会对内容的重要性进行分析,主要包括页面的权重和外部链接的权重;
第三分析目标网页的用户体验,主要包括打开速度、页面布局、结构、适配性等;
第四搜索引擎会加入反作弊规则,对进行恶意优化的网站进行惩罚;
第五对某些特定的结果进行人工干预;
第六是分析用户的查询历史,提供更优的结果。
同时搜索引擎会对用户打开网站的时长和跳出率进行二次分析,为该网页的用户体验打分。
下图就是整个引擎抓取规则和用户查询流程分析,希望对您有帮助。