搜索引擎的工作原理:抓取,编制索引和排名
发布时间:2019-04-28 10:26

正如我们在第1章中提到的,搜索引擎是应答机器。它们的存在是为了发现,理解和组织互联网的内容,以便为搜索者提出的问题提供最相关的结果。

为了显示在搜索结果中,您的内容首先需要对搜索引擎可见。它可以说是搜索引擎优化难题中最重要的一部分:如果找不到您的网站,您将无法进入SERP(搜索引擎结果页面)。

搜索引擎如何运作?

搜索引擎有三个主要功能:

  1. 抓取:在互联网上搜索内容,查看他们找到的每个网址的代码/内容。
  2. 索引:存储和组织在爬网过程中找到的内容。一旦页面在索引中,它就会在运行中显示为相关查询的结果。
  3. 排名:提供最能回答搜索者查询的内容,这意味着结果按最相关的顺序排列。

什么是搜索引擎抓取?

抓取是搜索引擎发送一组机器人(称为爬虫或蜘蛛)以查找新的和更新的内容的发现过程。内容可能会有所不同 - 可能是网页,图片,视频,PDF等 - 但无论格式如何,内容都是通过链接发现的。

那个词是什么意思?

遇到本节中任何定义的问题?我们的SEO词汇表具有章节特定的定义,可帮助您保持最新速度。

请参阅第2章定义 
搜索引擎漫游器(也称为蜘蛛)会在页面之间爬行以查找新的和更新的内容。

Googlebot首先提取几个网页,然后按照这些网页上的链接查找新网址。通过沿着这条链路跳过,爬虫能够找到新的内容并将其添加到名为Caffeine的索引中- 这是一个发现的URL的大型数据库 - 以便在搜索者查找该URL上的内容的信息时进行检索。很好的匹配。

什么是搜索引擎索引?

搜索引擎处理并存储他们在索引中找到的信息,索引是他们发现并认为足以为搜索者提供服务的所有内容的庞大数据库。

搜索引擎排名

当某人执行搜索时,搜索引擎会在其索引中搜索高度相关的内容,然后对该内容进行排序,以期解决搜索者的查询问题。搜索结果按相关性排序称为排名。通常,您可以假设网站排名越高,搜索引擎认为该网站对查询的相关性就越高。

可以阻止部分或全部站点的搜索引擎抓取工具,或指示搜索引擎避免在索引中存储某些页面。虽然可能有理由这样做,但如果您希望搜索者找到您的内容,则必须首先确保爬虫可以访问它并且可以编制索引。否则,它就像看不见一样好。

到本章结束时,您将拥有使用搜索引擎所需的上下文,而不是反对它!

在SEO中,并非所有搜索引擎都是平等的

许多初学者都对特定搜索引擎的相对重要性感到疑惑。大多数人都知道谷歌拥有最大的市场份额,但对Bing,雅虎和其他公司进行优化有多重要?事实是,尽管存在超过30个主要的网络搜索引擎,SEO社区真的只关注谷歌。为什么?简短的回答是谷歌是绝大多数人搜索网络的地方。如果我们包括谷歌图片,谷歌地图和YouTube(谷歌财产),超过90%的网络搜索都发生在谷歌上 - 这几乎是必应和雅虎合并的20倍。

抓取:搜索引擎可以找到您的网页吗?

正如您刚刚了解到的那样,确保您的网站被抓取并编入索引是显示在SERP中的先决条件。如果您已经拥有一个网站,那么最好先看看索引中有多少页面。这将对Google是否正在抓取并查找您想要的所有页面提供一些很好的见解,而不是您没有。

检查索引页面的一种方法是“site:yourdomain.com”,一个高级搜索运算符前往Google并在搜索栏中输入“site:yourdomain.com”。这将返回Google在其指定网站的索引中的结果:

网站的屏幕截图:在Google中搜索moz.com,显示搜索框下方的结果数量。

Google显示的结果数量(请参阅上面的“关于XX结果”)并不准确,但它确实让您清楚了解哪些网页在您的网站上编制索引以及它们当前如何显示在搜索结果中。

要获得更准确的结果,请在Google Search Console中监控并使用“索引覆盖率”报告。如果您当前没有,则可以注册免费的Google Search Console帐户使用此工具,您可以为您的网站提交站点地图,并监控实际添加到Google索引的已提交页面的数量等。

如果您没有在搜索结果中的任何位置显示,则可能有以下几种原因:

  • 您的网站是全新的,尚未抓取。
  • 您的网站未链接到任何外部网站。
  • 您网站的导航使机器人难以有效地抓取它。
  • 您的站点包含一些称为爬虫指令的基本代码,阻止搜索引擎。
  • 您的网站因Google垃圾邮件策略而受到了处罚。

告诉搜索引擎如何抓取您的网站

如果您使用Google Search Console或“site:domain.com”高级搜索运算符,并发现索引中缺少某些重要页面和/或某些不重要的页面被错误编入索引,则可以进行一些优化实施以更好地指导Googlebot您希望如何抓取您的网络内容。告诉搜索引擎如何抓取您的网站可以让您更好地控制索引中的内容。

大多数人都会考虑确保Google能够找到他们重要的页面,但很容易忘记有可能是您不希望Googlebot查找的页面。这些可能包括具有精简内容的旧URL,重复的URL(例如电子商务的排序和过滤器参数),特殊促销代码页,登台或测试页等等。

要使Googlebot远离您网站的某些网页和部分,请使用robots.txt。

robots.txt的

Robots.txt文件位于网站的根目录(例如yourdomain.com/robots.txt)中,并建议您的网站搜索引擎应该和不应该抓取哪些部分,以及他们抓取您网站的速度,通过特定的robots.txt指令

Googlebot如何处理robots.txt文件

  • 如果Googlebot无法找到网站的robots.txt文件,则会继续抓取该网站。
  • 如果Googlebot找到某个网站的robots.txt文件,它通常会遵守这些建议并继续抓取该网站。
  • 如果Googlebot在尝试访问网站的robots.txt文件时遇到错误,但无法确定是否存在,则不会抓取该网站。

优化抓取预算!

抓取预算是Googlebot在离开之前在您的网站上抓取的平均网址数,因此抓取预算优化可确保Googlebot不会浪费时间浏览您不重要的网页,而忽略了您的重要网页。抓取预算对于拥有数万个网址的超大型网站最为重要,但阻止抓取工具访问您绝对不关心的内容绝不是一个坏主意。只需确保不阻止抓取工具访问您已添加其他指令的网页,例如规范或无索引标记。如果Googlebot被阻止访问某个网页,则无法看到该网页上的说明。

并非所有网络漫游器都遵循robots.txt。意图不好的人(例如,电子邮件地址刮刀)会构建不遵循此协议的机器人。实际上,一些不良演员使用robots.txt文件来查找您的私人内容的位置。虽然从登录和管理页面等私有页面阻止抓取工具似乎合乎逻辑,以便它们不会显示在索引中,但将这些URL的位置放在可公开访问的robots.txt文件中也意味着具有恶意意图的人可以更容易地找到它们。NoIndex这些页面更好,并将它们放在登录表单后面,而不是将它们放在robots.txt文件中。

您可以在我们的学习中心robots.txt部分阅读有关此内容的更多详细信息

在GSC中定义URL参数

某些网站(最常见的电子商务)通过将某些参数附加到网址,在多个不同的网址上提供相同的内容。如果您曾在网上购物,则可能会通过过滤器缩小搜索范围。例如,您可以在亚马逊上搜索“鞋子”,然后按大小,颜色和样式优化搜索。每次细化时,URL都会略有变化:

https://www.example.com/products/women/dresses/green.htm

https://www.example.com/products/women?category=dresses&color=green

https://example.com/shopindex.php?product_id=32&highlight=green+dress
&CAT_ID = 1&的sessionid = 123 $ affid = 43

Google如何知道向搜索者提供哪个版本的网址?Google在确定代表网址方面做得非常出色,但您可以使用Google Search Console中的网址参数功能告诉Google您希望他们如何处理您的网页。如果您使用此功能告诉Googlebot“抓取没有带____参数的网址”,那么您实际上是要求从Googlebot隐藏此内容,这可能会导致从搜索结果中删除这些网页。如果这些参数创建了重复的页面,那就是你想要的,但如果你想要那些页面被索引,那就不是理想的了。

抓取工具可以找到所有重要内容吗?

既然您已了解确保搜索引擎抓取工具远离不重要内容的一些策略,那么让我们了解可以帮助Googlebot找到您重要网页的优化。

有时,搜索引擎可以通过抓取来查找您网站的某些部分,但其他网页或部分可能会因某种原因而模糊不清。确保搜索引擎能够发现您想要编入索引的所有内容,而不仅仅是您的主页,这一点非常重要。

问问你自己:能机器人爬行通过您的网站,而不是仅仅把它?

一个木板门,代表一个可以爬行但不能爬过的站点。

您的内容是否隐藏在登录表单后面?

如果您要求用户在访问某些内容之前登录,填写表单或回答调查,搜索引擎将无法看到这些受保护的页面。爬虫绝对不会登录。

您是否依赖搜索表单?

机器人无法使用搜索表单。有些人认为,如果他们在自己的网站上放置搜索框,搜索引擎就能找到访问者搜索的所有内容。

文本是否隐藏在非文本内容中?

非文本媒体表单(图像,视频,GIF等)不应用于显示您希望编入索引的文本。虽然搜索引擎在识别图像方面越来越好,但仍无法保证他们能够阅读和理解图像。最好在网页的<HTML>标记中添加文本。

搜索引擎可以关注您的网站导航吗?

正如抓取工具需要通过其他网站的链接发现您的网站一样,它需要您自己网站上的链接路径,以便在页面之间引导它。如果你有一个页面,你希望搜索引擎找到它,但它没有链接到任何其他页面,它就像看不见一样好。许多网站都以搜索引擎无法访问的方式构建导航,从而阻碍了他们在搜索结果中列出的能力。

可以通过抓取工具找到链接到的网页的方式,而未在网站导航中链接的网页则以岛屿形式存在,无法发现。

常见的导航错误可能会使抓取工具无法看到您的所有网站:

  • 移动导航显示的结果与桌面导航不同
  • 菜单项不在HTML中的任何类型的导航,例如启用JavaScript的导航。谷歌在抓取和理解Javascript方面已经做得更好,但它仍然不是一个完美的过程确保Google发现,理解和索引某些内容的更加可靠的方法是将其放入HTML中。
  • 个性化或显示特定类型的访问者与其他访问者的独特导航可能看起来隐藏在搜索引擎爬虫中
  • 忘记通过导航链接到您网站上的主页 - 请记住,链接是抓取工具跟随新页面的路径!

这就是为什么您的网站必须具有清晰的导航和有用的URL文件夹结构。

你有干净的信息架构吗?

信息架构是在网站上组织和标记内容以提高用户效率和可查找性的实践。最好的信息架构是直观的,这意味着用户不必非常努力地想通过您的网站或找到一些东西。

你在使用站点地图吗?

站点地图就是这样的:网站上的网址列表,抓取工具可以使用这些网址来发现和索引您的内容。确保Google找到最高优先级网页的最简单方法之一是创建符合Google标准的文件,并通过Google Search Console提交。虽然提交站点地图并不能取代对良好站点导航的需求,但它肯定可以帮助爬​​虫跟踪所有重要页面的路径。

确保您只包含要由搜索引擎编入索引的网址,并确保为抓取工具提供一致的路线。例如,如果您通过robots.txt屏蔽了该网址,或者在您的站点地图中包含重复的网址而不是首选的规范版本,请不要在您的站点地图中包含网址(我们将在第3章中提供有关规范化的更多信息)5!)。

了解有关XML站点地图的更多信息 

如果您的网站没有链接到其中的任何其他网站,您仍然可以通过在Google Search Console中提交XML站点地图来将其编入索引。不能保证他们会在索引中包含提交的URL,但值得一试!

抓取工具在尝试访问您的网址时是否收到错误?

在抓取您网站上的网址的过程中,抓取工具可能会遇到错误。您可以转到Google Search Console的“抓取错误”报告来检测可能发生这种情况的网址 - 此报告会显示服务器错误但未找到错误。服务器日志文件也可以向您显示此信息,以及其他信息(如抓取频率)的宝库,但由于访问和解析服务器日志文件是一种更高级的策略,我们不会在初学者指南中详细讨论,虽然你可以在这里了解更多

在使用爬网错误报告执行任何有意义的操作之前,了解服务器错误和“未找到”错误非常重要。

4xx代码:当搜索引擎抓取工具由于客户端错误而无法访问您的内容时

4xx错误是客户端错误,这意味着请求的URL包含错误的语法或无法实现。最常见的4xx错误之一是“404 - 未找到”错误。这些可能是由于URL错误,已删除页面或损坏的重定向而引起的,仅举几个例子。当搜索引擎点击404时,他们无法访问该URL。当用户点击404时,他们会感到沮丧并离开。

5xx代码:当搜索引擎抓取工具因服务器错误而无法访问您的内容时

5xx错误是服务器错误,这意味着网页所在的服务器无法满足搜索者或搜索引擎访问该页面的请求。在Google Search Console的“抓取错误”报告中,有一个专门针对这些错误的标签。这些通常是因为对URL的请求超时,因此Googlebot放弃了请求。查看Google的文档,了解有关修复服务器连接问题的详细信息。

值得庆幸的是,有一种方法可以告诉搜索者和搜索引擎您的页面已移动 - 301(永久)重定向。

创建自定义404页面!

通过添加指向您网站上重要网页的链接,网站搜索功能甚至是联系信息来自定义您的404页面。这样可以减少访问者在访问404时从网站反弹的可能性。

详细了解自定义404页面 
描述将一个页面重定向到另一个页面。


假设您将页面从example.com/young-dogs/移动example.com/puppies/搜索引擎和用户需要一个桥接从旧URL到新URL。该桥是301重定向。

  当你实现301时: 当你没有实现301时:  
链接权益 将链接权益从页面的旧位置转移到新URL。 如果没有301,则不会将以前URL中的权限传递给新版本的URL。
索引 帮助Google查找新版本的网页并为其编制索引。 仅在您的网站上出现404错误不会损害搜索性能,但让排名/被贩运的网页404导致他们从索引中脱离,排名和流量随之而来 - 哎呀!
用户体验 确保用户找到他们正在寻找的页面。 允许访问者点击死链接会将他们带到错误页面而不是目标页面,这可能令人沮丧。

301状态代码本身意味着该页面已永久移动到新位置,因此请避免将URL重定向到不相关的网页 - 旧网址内容实际上不存在的网址。如果某个页面对某个查询进行了排名,而您将其301列为具有不同内容的网址,则可能会降低排名位置,因为使其与该特定查询相关的内容不再存在。301s功能强大 - 负责任地移动网址!

您还可以选择302重定向页面,但这应该保留用于临时移动以及传递链接权益不是一个大问题的情况。302s有点像道路绕道而行。你是暂时通过某条路线吸收流量,但它永远不会那样。

注意重定向链!

如果必须经过多次重定向,Googlebot可能很难访问您的网页。谷歌称之为“重定向链”,他们建议尽可能地限制它们。如果您将example.com/1重定向到example.com/2,然后决定将其重定向到example.com/3,最好取消中间人并简单地将example.com/1重定向到example.com/3。

详细了解重定向链 

一旦确保您的网站针对可抓取性进行了优化,下一步的业务就是确保可以将其编入索引。

索引:搜索引擎如何解释和存储您的网页?

一旦确保您的网站已被抓取,下一个业务目标就是确保可以将其编入索引。这是正确的 - 只是因为您的网站可以被搜索引擎发现和抓取并不一定意味着它将存储在他们的索引中。在上一节关于抓取的部分中,我们讨论了搜索引擎如何发现您的网页。索引是存储已发现页面的位置。在爬虫找到页面后,搜索引擎会像浏览器一样呈现它。在这样做的过程中,搜索引擎分析该页面的内容。所有这些信息都存储在其索引中。

存放书的机器人在图书馆里。

继续阅读以了解索引如何工作以及如何确保您的站点进入这个非常重要的数据库。

我可以查看Googlebot抓取工具如何查看我的网页吗?

是的,您网页的缓存版本将反映Googlebot上次抓取该网页时的快照。

Google会以不同的频率抓取和缓存网页。经常发布的知名网站https://www.nytimes.com的知名网站将比罗杰莫兹博特的喧嚣网站http://www.rogerlovescupcakes.com(如果它只是真实...)

您可以通过单击SERP中URL旁边的下拉箭头并选择“缓存”来查看页面的缓存版本:

在SERP中查看缓存结果的屏幕截图。

您还可以查看网站的纯文本版本,以确定是否正在有效地抓取和缓存重要内容。

页面是否已从索引中删除?

是的,页面可以从索引中删除!可能会删除URL的一些主要原因包括:

  • URL返回“未找到”错误(4XX)或服务器错误(5XX) - 这可能是偶然的(页面被移动并且没有设置301重定向)或故意(页面被删除和404ed以便把它从索引中删除)
  • 该URL添加了noindex元标记 - 网站所有者可以添加此标记,以指示搜索引擎从其索引中省略该页面。
  • 该网址因违反搜索引擎的网站站长指南而受到人工处罚,因此已从索引中删除。
  • 在访问者可以访问该页面之前,通过添加密码来阻止URL进行爬网。

如果您认为以前在Google索引中的网站上的某个页面不再显示,您可以使用网址检查工具了解该网页的状态,或使用具有“请求索引”功能的Google抓取方式将单个URL提交到索引。(额外奖励:GSC的“获取”工具还有一个“渲染”选项,可让您查看Google在解释您的网页时是否存在任何问题)。

告诉搜索引擎如何索引您的网站

机器人元指令

元指令(或“元标记”)是您可以向搜索引擎提供有关您希望如何处理网页的说明。

您可以告诉搜索引擎抓取工具,例如“不要在搜索结果中将此页面编入索引”或“不将任何链接权益传递给任何页面上的链接”。这些说明通过HTML页面的<head>中的机器人元标记(最常用)或通过HTTP标头中的X-Robots-Tag执行。

机器人元标记

机器人元标记可以在网页HTML的<head>中使用。它可以排除所有或特定的搜索引擎。以下是最常见的元指令,以及您可能应用它们的情况。

index / noindex告诉引擎是否应该抓取页面并将其保存在搜索引擎的索引中以供检索。如果您选择使用“noindex”,那么您正在与希望从搜索结果中排除该页面的抓取工具进行通信。默认情况下,搜索引擎假设它们可以索引所有页面,因此不需要使用“索引”值。

  • 当您使用时:如果您尝试从Google的网站索引中修剪精简页面(例如:用户生成的个人资料页面),您可以选择将网页标记为“无索引”,但您仍希望访问者可以访问这些网页。

follow / nofollow告诉搜索引擎应该遵循页面上的链接还是nofollow。“关注”会导致机器人跟踪您网页上的链接并将链接权益传递到这些网址。或者,如果您选择使用“nofollow”,搜索引擎将不会关注或将任何链接权益传递到页面上的链接。默认情况下,假定所有页面都具有“follow”属性。

  • 当您使用时: nofollow通常与noindex一起使用,当您尝试阻止页面被编入索引以及阻止搜寻器跟踪页面上的链接时。

noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下,引擎将保留其索引的所有页面的可见副本,搜索者可通过搜索结果中的缓存链接访问这些页面。

  • 当您使用时:如果您运行电子商务网站并且您的价格定期更改,您可能会考虑使用noarchive标签来阻止搜索者看到过时的定价。

以下是元机器人noindex,nofollow标签的示例:

<!DOCTYPE html>
<HTML>
<HEAD>
<meta name =“robots”content =“noindex,nofollow”/>
</ HEAD>
<BODY> ... </ BODY>
</ HTML>

此示例将所有搜索引擎排除在索引页面和跟随任何页面上链接之外。如果您想要排除多个抓取工具(例如googlebot和bing),则可以使用多个机器人排除标记。

元指令影响索引,而不是爬行

Googlebot需要抓取您的网页以查看其元指令,因此,如果您尝试阻止抓取工具访问某些网页,则不会采用元指令。必须抓取机器人标签才能得到尊重。

X-Robots-Tag中

x-robots标记用于URL的HTTP标头,如果您想大规模阻止搜索引擎,则可以提供比元标记更多的灵活性和功能,因为您可以使用正则表达式,阻止非HTML文件以及应用整个网站的noindex标记。

例如,您可以轻松地排除整个文件夹或文件类型(例如moz.com/no-bake/old-recipes-to-noindex):

<Files〜“\ /?no \ -bake \ /.*”>
 标题设置X-Robots-Tag“noindex,nofollow”
</文件>

机器人元标记中使用的衍生物也可用于X-Robots-Tag。

或特定文件类型(如PDF):

<Files〜“\。pdf $”>
 标题设置X-Robots-Tag“noindex,nofollow”
</文件>

有关Meta Robot标签的更多信息,请浏览Google的机器人元标签规范

WordPress提示:

在仪表板>设置>阅读中,确保选中“搜索引擎可见性”框这会阻止搜索引擎通过robots.txt文件访问您的网站!

了解影响抓取和编制索引的不同方法可以帮助您避免可能导致重要网页无法找到的常见陷阱。

排名:搜索引擎如何对网址进行排名?

搜索引擎如何确保当有人在搜索栏中输入查询时,他们会得到相关的结果?该过程称为排名,或者与特定查询最不相关的搜索结果的排序。

对排名的艺术诠释,三只狗坐在第一,第二和第三位的基座上。

为了确定相关性,搜索引擎使用算法,过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。多年来,这些算法经历了许多变化,以提高搜索结果的质量。例如,Google每天都会进行算法调整 - 其中一些更新是次要的质量调整,而其他更新是部署用于解决特定问题的核心/广泛算法更新,例如企鹅解决链接垃圾邮件问题。查看我们的Google算法更改历史记录,查看可追溯到2000年的已确认和未经证实的Google更新列表。

为什么算法经常变化?谷歌只是想让我们保持警惕吗?虽然谷歌并不总是透露具体信息,说明他们为何会这样做,但我们确实知道谷歌在进行算法调整时的目标是提高整体搜索质量。这就是为什么,为了回应算法更新问题,Google会回答一些问题:“我们一直在进行质量更新。” 这表明,如果您的网站在进行算法调整后受到影响,请将其与Google的质量指南搜索质量评估指南进行比较,两者都非常适合搜索引擎的需求。

搜索引擎想要什么?

搜索引擎一直想要同样的事情:以最有用的格式为搜索者的问题提供有用的答案。如果这是真的,那么为什么SEO现在与过去几年不同?

从某人学习新语言的角度考虑一下。

起初,他们对语言的理解非常简陋 - “参见Spot Run。”随着时间的推移,他们的理解开始加深,他们学习语义 - 语言背后的意义以及单词和短语之间的关系。最终,通过足够的练习,学生能够很好地理解语言,甚至能够理解细微差别,并且能够为甚至模糊或不完整的问题提供答案。

当搜索引擎刚开始学习我们的语言时,通过使用实际违反质量指南的技巧和策略来游戏系统要容易得多。以关键字填充为例。如果你想为某个特定的关键词排名,比如“有趣的笑话”,你可以在你的页面上多次添加“有趣的笑话”这些词,然后加粗,以期提高你对该词的排名:

欢迎来到有趣的笑话我们讲述世界上最有趣的笑话有趣的笑话乐趣和疯狂。有趣的笑话等待着。坐下来阅读有趣的笑话,因为有趣的笑话可以让你快乐和有趣一些有趣的搞笑搞笑笑话

这种策略造成了糟糕的用户体验,而不是嘲笑有趣的笑话,人们被恼人的,难以阅读的文字轰炸。它可能在过去有效,但这绝不是搜索引擎想要的。

角色链接在SEO中发挥作用

当我们谈论链接时,我们可能意味着两件事。反向链接或“入站链接”是指向您网站的其他网站的链接,而内部链接是您自己网站上指向其他网页(在同一网站上)的链接。

描述入站链接和内部链接的工作原理。

链接历史上在SEO中发挥了重要作用。很早以前,搜索引擎需要帮助确定哪些URL比其他URL更值得信赖,以帮助他们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数有助于他们这样做。

反向链接与现实生活中的WoM(口碑)推荐非常相似。让我们以假想的咖啡店Jenny's Coffee为例:

  • 其他人的推荐=权威的良好迹象
    • 示例:许多不同的人都告诉过你,Jenny's Coffee是镇上最好的
  • 你自己的推荐=有偏见,所以不是权威的好兆头
    • 例如: Jenny声称Jenny's Coffee是镇上最好的咖啡
  • 来自不相关或低质量来源的推荐=不是权威的好兆头,甚至可能会让您被标记为垃圾邮件
    • 例如:珍妮付钱给那些从未去过她的咖啡店的人告诉别人有多好。
  • 没有推荐=不明确的权威
    • 例如: Jenny's Coffee可能会很好,但您无法找到任何有意见的人,所以您无法确定。

这就是创建PageRank的原因PageRank(谷歌的核心算法的一部分)是一个链接分析算法,以谷歌的创始人之一拉里佩奇命名。PageRank通过衡量指向网页的链接的质量和数量来估计网页的重要性。假设网页越相关,重要且值得信赖,它将获得的链接越多。

您从高权威(可信赖)网站获得的自然反向链接越多,您在搜索结果中排名越高的几率就越高。

角色内容在SEO中扮演

如果他们没有将搜索者引向某些东西,就没有任何关联点。那东西是满足的!内容不仅仅是文字; 它是任何意味着被搜索者消费的东西 - 有视频内容,图像内容,当然还有文字。如果搜索引擎是应答机器,则内容是引擎提供这些答案的手段。

每当有人进行搜索时,都会有数千种可能的结果,那么搜索引擎如何确定搜索者将找到哪些有价值的页面呢?确定页面对给定查询的排名位置的一个重要部分是页面上的内容与查询的意图相匹配的程度。换句话说,这个页面是否匹配搜索到的单词并帮助完成搜索者试图完成的任务?

由于这种关注用户满意度和任务完成度,因此没有严格的基准来确定您的内容应该有多长,应该包含关键字的次数,或者您在标题标记中放置的内容。所有这些都可以在页面在搜索中的表现如何发挥作用,但重点应放在将要阅读内容的用户身上。

今天,有数百甚至数千个排名信号,前三名保持相当一致:链接到您的网站(作为第三方可信度信号),页面内容(满足搜索者意图的高质量内容),以及RankBrain。

什么是RankBrain?

RankBrain是Google核心算法的机器学习组件。机器学习是一种计算机程序,通过新的观察和训练数据不断改进其预测。换句话说,它总是在学习,并且因为它总是在学习,所以搜索结果应该不断改进。

例如,如果RankBrain注意到排名较低的URL向用户提供比排名较高的URL更好的结果,则可以打赌RankBrain将调整这些结果,将更相关的结果移动得更高并将较低相关页面降级为副产品。

显示结果如何变化并且足够易变以显示不同排名甚至数小时后的图像。

像大多数使用搜索引擎的东西一样,我们并不确切知道什么是RankBrain,但很明显,谷歌的人也不知道

这对SEO有何意义?

由于谷歌将继续利用RankBrain推广最相关,最有帮助的内容,因此我们需要专注于比以往更多地实现搜索者的意图。为可能登陆您页面的搜索者提供最佳信息和体验,并且您已经迈出了在RankBrain世界中表现良好的第一步。

参与度量:相关性,因果关系或两者兼而有之?

通过谷歌排名,参与度指标很可能是部分关联和部分因果关系。

当我们说参与度指标时,我们指的是代表搜索者如何通过搜索结果与您的网站进行互动的数据。这包括以下内容:

  • 点击次数(来自搜索的访问)
  • 页面上的时间(访问者在离开之前在页面上花费的时间)
  • 跳出率(用户仅查看一页的所有网站会话的百分比)
  • Pogo-sticking(点击有机结果,然后快速返回SERP选择另一个结果)

许多测试,包括Moz自己的排名因素调查,都表明参与度指标与更高的排名相关,但因果关系一直备受争议。良好的互动指标是否仅仅表明排名很高的网站?或者网站排名高,因为他们拥有良好的互动指标?

谷歌所说的话

虽然他们从未使用过“直接排名信号”这一术语,但Google明确表示他们绝对会使用点击数据来修改特定查询的SERP。

根据Google前搜索质量主管 Udi Manber的说法

“排名本身受点击数据的影响。如果我们发现,对于特定查询,80%的人点击#2,只有10%点击#1,过了一段时间我们发现可能#2是人们想要的,所以我们将切换它。“

谷歌前工程师Edmond Lau的另一个评论证实了这一点:

“很明显,任何合理的搜索引擎都会在自己的搜索引擎上使用点击数据反馈到排名中,以提高搜索结果的质量。使用点击数据的实际机制通常是专有的,但谷歌明显表示它使用点击数据及其专利等系统,如排名调整的内容项目。“

由于Google需要维护和提高搜索质量,因此参与度指标不仅仅是相关性似乎是不可避免的,但似乎Google未能将参与度指标称为“排名信号”,因为这些指标用于提高搜索质量,单个URL的排名只是其中的副产品。

哪些测试已经证实

各种测试已经确认谷歌将根据搜索者的参与情况调整SERP订单:

  • Rand Fishkin 2014年的测试结果显示,在让大约200人点击SERP的URL后,#7的结果一直升至第一位。有趣的是,排名改进似乎与访问链接的人的位置隔离开来。排名位置飙升在美国,许多参与者所在的位置,而在谷歌加拿大,谷歌澳大利亚等页面上的排名仍然较低。
  • Larry Kim对 RankBrain之前和之后的首页及其平均停留时间的比较似乎表明,Google算法的机器学习组件降低了人们不会花费太多时间的页面的排名位置。
  • Darren Shaw的测试也显示了用户行为对本地搜索和地图包结果的影响。

由于用户参与度指标明确用于调整SERP的质量,并将排名位置更改为副产品,因此可以肯定地说,SEO应优化参与度参与不会改变网页的客观质量,而是改变您对搜索者相对于该查询的其他结果的价值。这就是为什么在没有更改您的网页或其反向链接后,如果搜索者的行为表明他们更喜欢其他网页,则排名会下降。

在对网页进行排名方面,参与度指标就像一个事实检查者。诸如链接和内容之类的客观因素首先对页面进行排名,然后参与度指标可帮助Google调整,如果他们没有做到正确的话。

搜索结果的演变

当搜索引擎缺乏今天的复杂性时,“10蓝色链接”一词被用来描述SERP的扁平结构。无论何时进行搜索,Google都会返回一个包含10个自然结果的页面,每个结果都采用相同的格式。

10-blue-links SERP的截图。

在这个搜索领域,持有#1点是SEO的圣杯。但后来发生了一件事。谷歌开始在搜索结果页面上添加新格式的结果,称为SERP功能其中一些SERP功能包括:

  • 付费广告
  • 精选片段
  • 人们也问箱子
  • 本地(地图)包
  • 知识小组
  • 附加链接

谷歌一直在增加新的。他们甚至尝试了“零结果SERP”,这种现象只有知识图表的一个结果显示在SERP上,除了“查看更多结果”选项之外没有任何结果。

由于两个主要原因,这些功能的添加引起了一些初步的恐慌。首先,许多这些功能导致有机结果在SERP上进一步推迟。另一个副产品是搜索器点击有机结果的次数较少,因为SERP本身正在回答更多查询。

那谷歌为什么会这样做呢?这一切都可以追溯到搜索体验。用户行为表示不同内容格式可以更好地满足某些查询。请注意不同类型的SERP功能如何匹配不同类型的查询意图。

查询意图 触发可能的SERP功能
信息化 精选片段
信息与一个答案 知识图/即时答案
本地 地图包
交易 购物

我们将在第3章中更多地讨论意图,但是现在,重要的是要知道答案可以以多种格式提供给搜索者,以及如何构建内容可能会影响它在搜索中出现的格式。

本地化搜索

像谷歌这样的搜索引擎拥有自己的本地商业列表专有索引,可以从中创建本地搜索结果。

如果您正在执行的具有物理位置的客户可以访问企业的本地搜索引擎优化工作(例如:牙医)或为前往参观他们的客户(例如:管道工)业务,请务必要求,验证和优化一免费的Google我的商家信息

在本地化搜索结果方面,Google使用三个主要因素来确定排名:

  1. 关联
  2. 距离
  3. 突出物

关联

相关性是当地企业与搜索者所寻求的匹配程度。为确保业务部门能够尽一切可能与搜索者相关,请确保完整准确地填写业务信息。

距离

Google会使用您的地理位置来更好地为您提供本地搜索结果。本地搜索结果对邻近度极其敏感,其指的是搜索者的位置和/或查询中指定的位置(如果搜索者包括一个)。

有机搜索结果对搜索者的位置很敏感,但很少像本地包装结果那样明显。

突出物

作为一个突出因素,谷歌正在寻求奖励在现实世界中众所周知的企业。除了商业“离线突出”之外,谷歌还会考虑一些在线因素来确定本地排名,例如:

评测

本地商家收到的Google评论数量以及这些评论的情绪会对他们在本地搜索结果中排名的能力产生显着影响。

引文

“商业引用”或“商业列表”是对本地化平台(Yelp,Acxiom,YP,Infogroup,Localeze等)上的本地商家“NAP”(姓名,地址,电话号码)的基于Web的引用。 。

本地排名受当地商业引用的数量和一致性的影响。谷歌从不同来源获取数据,不断构成其本地商业指数。当Google发现对商家名称,位置和电话号码的多个一致引用时,它会加强Google对该数据有效性的“信任”。这导致Google能够以更高的信心展示业务。Google还使用来自网络上其他来源的信息,例如链接和文章。

有机排名

SEO最佳实践也适用于本地搜索引擎优化,因为谷歌在确定本地排名时也会考虑网站在自然搜索结果中的位置。

在下一章中,您将学习有助于Google和用户更好地理解您的内容的页面最佳做法。

[奖金!]当地参与

尽管Google未将其列为本地排名因素,但参与的作用只会随着时间的推移而增加。Google通过整合真实世界的数据,如访问的平均时间和平均访问时间,继续丰富本地结果......

对某个当地企业的引用准确性感到好奇吗?Moz有一个免费的工具可以提供帮助,恰如其分地命名为Check Listing。

检查列表准确性 
“热门时间访问”的屏幕截图导致本地搜索。

......甚至为搜索者提供了询问业务问题的能力!

问题与解答的屏幕截图导致本地搜索。

毫无疑问,现在比以往任何时候都更加受到现实世界数据的影响。这种互动性是搜索者与本地企业互动和响应的方式,而不是纯粹的静态(和游戏能力)信息,如链接和引用。

由于Google希望向搜索者提供最佳,最相关的本地商家,因此他们使用实时互动指标来确定质量和相关性是完全合理的。


服务热线