搜索引擎是如何运作的

一直在说搜索引擎,那么它到底是如何运作的呢?

下面来试着描述一下这个过程。


搜索引擎就是一个巨大的机器,就是首先有一个抓取工具,Google的称之为 googlebot,从网络中抓取(提取)网页,然后将网页编入索引,有时我们也称之为收录,索引呢就是一个强大的数据库,搜索引擎会将所知道的所有网页都储存在这个索引中,每个网页的索引条目都会描述该网页的内容和位置(网址),甚至有网页的缓存。网站上的网页被收入索引,是最初的那一步,没有被收录,其它的都谈不上。

注意:搜索引擎收录网页是不会收费的,当然如果你的网站一直没有被收录,那么你的网站可能有什么地方做错了。你需要找一个专家来帮你。

在收录后,这些索引只是最基本的数据,搜索引擎会根据数百种排名因素来对这些网页进行排名,这些排名因素,搜索引擎不会公开,有时候可能他们会确认存在某个排名因素,但是绝不会告诉你这个排名因素的重要程度。

比如 Google 承认,网页的载入速度是排名因素之一,HTTPS 也是。但是你不知道这些部分有多重要。

当互联网用户,在搜索框中输入一个搜索关键词后,按下回车,这个关键词就会传到搜索引擎,搜索引擎就会根据这个关键词,来猜测用户的目的,然后根据它之前做的排名,按相关度把搜索结果返回到用户的搜索界面。

但是这里还有很多细节,比如搜索引擎如何猜测用户的搜索目的,它可能会根据你所在的地区,城市,搜索当时的时间,你过往的浏览记录,之前搜索的关键词。这些都会成为搜索引擎推测用户目的的手法。当然它所提供的搜索结果不只是那么的单一,它会推测一个用户的主要目的,然后围绕这个目的,还会有一些相关联的搜索目的可以提供一些搜索结果。

借用一张百科的图片,未必准确,但可以做参考。

search-engine.jpg

从整个过程来看搜索引擎的三大部分。

抓取网页到索引 网页排名 搜索结果

作为站长,首先要帮助搜索引擎了解自己的网站,提供尽可能的方便给它来发现新网页,抓取新网页。其次要提供有用的信息,提供给用户高品质的网站内容,网站可以让各种设备都能轻松使用,网站的安全性得到保障。

搜索引擎的市场份额

以桌面电脑和笔记本电脑来看,过去的十二个月:

Google 占有全球 75.5% 的份额 百度 占有全球 10.5% 的份额 Bing 占有 8.2% 的份额

search-engine-market-share.jpg如果看移动设备的话,包括手机,平板,手持设备,同样看过去的十二个月:

Google 占有全球 81.32% 的份额 百度占有全球 15.82% 的份额 Yahoo 占有1.08%。

数据来源

搜索引擎是如何抓取网页的呢?

回头看一眼抓取这个过程。

这个互联网,顾名思义就是无数张网页,通过相互之间的链接而连接起来,搜索引擎是通过链接来发现新的网页的,然后搜索引擎的抓取工具, Googlebot,或者我们戏称它为蜘蛛,在这正巨大的网上面爬取新发现的网页内容。

现在除了搜索引擎从新链接发现新的网页之外,站长还可以通过提交 sitemap 给搜索引擎的站长工具,来通知搜索引擎,新的网页链接。目前各大搜索引擎都已经提供了站长工具,方便提交 sitemap。

以 Google 为例,Googlebot 是通过跟踪链接,站点地图(sitemap),以及重定向在各个网址之间移动。

网页上需要保证有足够的文字内容,比如视频中的文字并不会被了解,那样就需要在嵌入视频的页面,添加适当的文字描述。而网页上的链接,如果你希望 Googlebot 能够跟踪这个链接,那么记得使用 <a href >

小结

如果想成为一成功的SEO,那么知道搜索引擎是如何工作是非常重要的一步,明白它的原理,才能有针对性的完成网站的优化。

在此,我们了解了:

搜索引擎的数据库时经过抓取和收录后产生的 Googlebot 之类的蜘蛛,是通过链接来发现新网页的 站长可以通过 sitemap 或者手工提交网址,来缩短蜘蛛发现新网页的时间 有几百个会影响网页排名的因素,链接是最重要的因素之一 不是所有的外部链接都由相同的权重 搜索引擎的目的是帮助搜索用户找到最能解决他们问题的那个网页

文章来源:

Author:David Yin
link:https://seo.g2soft.net/2019/05/28/how-search-engines-work.html