我们在Google中进行搜索时,如果搜索结果比较少,有时候会发现有的网页后面被标记为“补充材料”(Supplemental Result)。补充材料是什么东西呢?
补充材料的网站是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到我们的补充索引里。
将网站包括其中的索引是完全自动的,没有任何方式可以选择或更改您网站的索引。请放心,包含网站的索引不会影响该网站的PageRank。
根据Google的说法,作为补充材料的网页,只是一种辅助、补充的索引,并不作为主要索引。也就是说,这些网页并非在Google的主数据库中,而是在辅助数据库中。一般情况下,当我们在Google进行搜索时,他展现给我们的结果,是主数据库中的网页,并非辅助数据库中的网页。由此可以得出结论,作为补充材料的网页,在Google的表现会非常非常的差。
根据一些搜索引擎关注者的观察,作为补充材料的网页,被Google爬虫爬行的间隔时间非常长,很多时候几个月、甚至半年都不会被Google爬虫造访,严重影响网页在Google数据库中的更新。同时这些网页的排名非常差,只有在搜索结果很少的时候,才会被Google列出来。一般情况下,根本无法在搜索结果里看见这些网页。
如果网页被Google列为补充材料,这对于网站来说,是一件不幸的事情。被列为补充材料的网页,在搜索结果中的排名,都会表现非常差。
是什么原因造成了网页被Google认为补充材料呢?从Google自己提供的信息中,我们看不到任何有价值的资料。主要原因可能是网页的Head部分的Description书写不规范造成的。
某位搜索引擎关注者曾经有6个相同主题的网站,这些网站都是用同一个数据库生成的,其中有100多个网页的内容几乎完全一样,而且都是用XHTML+CSS技术制作。在这些网站中,只有一个网站的所有网页不是补充材料,其他的网站的页面,除了首页之外全部都补充材料。因此怀疑补充材料是由于复制网页造成的。
在分析了不是补充材料的网站的网页后,还发现只有这个网站的Description书写规范,Description内容由成段的句子组成,与网页的内容吻合;而被作为补充材料的网页,Description内容书写得都很不规范,都是将关键词堆砌几遍。发现这个问题后,搜索引擎关注者将其中某些网站网页的Description修改为规范的写法,以期观察。但是由于Google几个月都不更新这些页面,无法观察到结果。于是,搜索引擎关注者又用同样的数据库,做了两个网站,这两个网站的内容与以前的网站几乎完全相同,但是Description采用规范的写法。这两个网站被Google收录后,所有网页都不是补充材料。
由此,得出结论,Google补充材料形成的原因是:网页的Description写法不规范。
还有一些网页,成为了所谓的“信息孤岛”,没有任何连接指向这些网页,这样的网页也是会被Google列为补充材料的。有些网页,连接埋藏得太深,连接向他的网页没有被Google收录,这样的网页,也会被Google认为是补充材料网页。
解决网页被Google列为补充材料的方法,就是规范书写Description。不要在Description里堆砌关键词,Description的内容要与页面的内容吻合;保持合理的网站结构,确保每个页面都有连接指向,并且连接不被埋藏得很深。
另外还有一个说法是 google 在down的时候(就是gg数据库的不同的服务器数据同步切换的时候,也常常出现 这样的情况。