在搜索引擎优化中网站排名是很重要的一部分,不论是请网络公司做站点优化还是自己来操作站点优化,笔者始终认为关键词排名直接关系到了网站的流量、转换率。目前互联网上的站点数亿个,同行业的竞争站点也很多,而百度、谷歌等给予的首页排名也就是十个位置,所以基本上首页的十个位置就成为了企业必争之地。对于网站优化来说一方面搜索引擎是支持的,因为他们出台了很多针对网站优化的声明;另一方面搜索引擎对正在做优化的网站又有一定的压制作用,因为怕他们提供的内容不符合用户需求而造成本身用户流失现象。所以,搜索引擎会对网站进行监察,那么搜索引擎又是如何知道我们的站点正在做SEO呢?中文搜索引擎就这方面来说好像不太明显,而诸如谷歌这样的搜索引擎就比较明显了。下面,笔者就以谷歌为例,和大家一起分析搜索引擎如何知道我们控制的网站以及它为什么重要。
Google对我们拥有的网站了解多少?可以利用我们的优势吗?可以用来处罚网站吗?这些都是网站优化人员经常提出的重要问题。从技术上讲,现在在网站之间存在关系时,当我们拥有网站时,便拥有许多要控制的网站,这在传统上称为管理关系,这意味着我们是优化人员。我们可以控制网站上的链接。我们可以控制网站的内容。也许这些是我们拥有的子域名,也许这些是我们业务中的多个属性。但是Google在过去的时间里花费了巨大的精力试图弄清网站之间的管理关系,这不仅可以帮助我们,有时还可以减少这些网站之间的链接,或者可能带来一些负面影响。之所以对Google如此重要,是因为,如果我们考虑链接图和站点之间的关系,那么由同一人控制的站点之间的链接可能不应该像由其他人编辑和控制的链接那样多人们,因为当我们获得链接时,我们希望它们是自然的,而不是我们可以控制的东西。
很多时候Google希望奖励我们彼此相关的链接。在我们拥有的网站之间建立那些关系有一定的优势,有时我们想告诉Google我们拥有多个网站。有时,这在较小的范围内也起作用,通常在子域名上。我们会看到很多博客都在子域名的网站上启动,因为从开发角度或出于任何原因,它都更容易。我们希望该子域名和该博客具有与主站点相同的权限。现在,通常由Google决定是否将权限授予我们的博客或我们的子域名。但是,如果我们可以给他们一些信号来告诉他们:“是的,这与我的主域名有关”这通常在帮助该子域名进行排名方面大有帮助。
与备用语言相同。我们有中文内容,有法语内容,有英文内容。它们都在我们的网站上,也许它们位于不同的子域名或不同的顶级域名中,但是我们希望Google知道它们具有与我们花了很长时间建立的主要站点相同的权限。此外,我们开始看到身份在管理关系中发挥作用,更多的是在页面级别上使用Google Authorship之类的东西。但是身份正在成为一个大问题,Google正在努力找出网络上的那些身份。
其次是行政关系的另一面。传统上,这就是SEO和网站优化人员在考虑这些问题时一直在处理的内容。最大的问题是链路公平性下降。再一次,Google看到我们控制了这些站点的问题,为什么它们要传递与我们不控制的站点一样多的链接权?因此,许多黑帽SEO和灰帽SEO竭尽全力隐藏网站之间的关系,因为他们不希望Google对该链接资产进行折价。此外,还有在不良社区中使用链接方案的想法。如果有12个站点,并且它们之间都相互链接,那么对Google可能是一个很好的信号,表明这是一种链接方案,这些链接不应计算,否则可能会受到处罚。最后,我们在Google中看到了一种新现象:网络上的人受到惩罚。在这些情况下,人们会受到惩罚,于是决定只是重新开始一个全新的领域名。但是,当他们这样做时令人惊讶的是,即使他们削减了所有反向链接,他们也会发现处罚转移到了新域名。他们更改了URL以及所有内容。
那么问题来了,Google是如何知道那是同一网站的呢?这些是要问自己并帮助我们确定的重要问题,通过在站点之间建立这些关系可以为我们提供帮助,还是会受到处罚?如果我们了解Google使用的某些信号,则可以利用它。现在我要强调的一件事是我们并不了解所有信号。不过有一些线索告诉我们在传统上,Google一直在研究所有权,WhoIs记录等内容,这些内容可以非常免费地从Internet上获取,托管我们的站点,IP地址等等,我们要去检查谁拥有什么的网站的名称是什么?Google Analytics分析代码或相同AdSense代码上的所有这些网站之间的所有关系。所有这些信息都可以在网上公开获得,我们不需要访问我们的Google Analytics分析帐户或AdSense帐户,这些都是存在于网站的源代码中的。通过抓取网络并将所有这些信息收集在一起,我们可以创建一个易于剖析的所有权网络。传统上C块已指示了网络上的关系,不过,现在我们正处于过渡之中,网络正在迁移到新的Internet协议版本,旧的C块基于版本4。因此,C块实际上已经不存在了,而我们正在寻找一些新的C块。报告标准而不是C块,因为我们很快就会丢失这些。同样,当我们再次有很多站点彼此链接并且Google拥有完整的链接目录或网络上最完整的链接目录时,使用各种统计分析将所有这些结合在一起时,链接模式方法,我们可以非常紧密地确定谁与什么相关联,谁可以控制什么。这些都是人们正在查看的所有事物,所有可公开识别的信息。
人们通常不考虑的一些信号就是我所说的软信号或内容信号。这些是人们实际上并不总是在思考的更高级的信号,但是就像我们在专利文件中看到的Google所看到的那样,就像两个站点具有相同或相似的内容,即网站A与网站B上的内容相同。这对于Google可能是同一网站是一个很强的线索。他们可能会寻找其他一些东西,如谁拥有注册或分析代码或类似的东西,因为许多网站被处罚了,那这就不是一个很明确的信号。但是,如果我们只是将站点从一个站点移至另一个站点以免受到处罚,那么如果我们使用的是完全相同的内容以及其他一些东西,那可能还是不够的。在不同站点上托管的具有相同内容的两个图片可能表明这些站点由同一实体拥有。
格式化CSS时,我们经常会看到同一个人拥有的网站使用很多相同的WordPress模板或者使用很多相同的CSS文件或JavaScript文件。这并不是一个明确的线索,因为那里有很多模板,互联网上散布着许多免费的东西。但是,当与其他信号结合使用时,它可以非常清楚地表明这些关系。即使只是关于“关于我们”页面上的联系方式之类的简单信息,如果各个站点之间的联系信息相同,则很显然这些站点是相关的。然后在页面级别,我们拥有诸如作者身份之类的东西。对于某些作者,我在深入的文章中已经看到了这项工作的很好。这不是域名级别的信号,而是更多的页面级别信号,可以帮助各个页面进行排名。对于内容和语言信号,同样,这是当我们在不同国家/地区使用不同语言的网站时,使用此属性可以帮助建立那些关系以帮助我们排名。