你发布了一篇很棒的页面,但 Google 完全不知道它的存在
页面已经上线了,内容也不错,URL 也能正常打开。但如果网站上没有任何其他页面链接到它,它就是一个孤儿页面——Google 大概率从来没发现过它。
搜索引擎通过跟踪链接来发现页面。如果从首页(或者任何已收录的页面)出发都没有一条路径能到达某个页面,Googlebot 就没办法去访问它。就好比一间没有门的房间。
孤儿页面是怎么产生的
很少有人会故意创建孤儿页面。常见的原因包括:
- CMS 自动生成的页面没有被加入导航或站点地图
- URL 结构变更导致原来指向该页面的链接断裂
- 创建了内容但从来没有从博客列表、分类页或相关文章中链接过去
- 旧页面因为链接它们的页面被删除或重新设计而失去了所有内部链接
- 营销活动的落地页创建后从来没有整合到网站结构中
对 SEO 的影响
无法被爬取。 如果 Google 到不了这个页面,就无法收录它。内容再好,等于不存在。
没有排名权重。 即使 Google 通过站点地图或外部链接偶然发现了这个页面,它也接收不到任何内部链接权重。相当于带着空油箱上赛道。
浪费内容投入。 有人花了时间和精力创作那个页面。没有内部链接,这些投入就打了水漂。
站点地图解决不了这个问题
"但我把它加到 sitemap 里了!"——没错,这确实能帮助 Google 发现这个 URL。但站点地图不传递链接权重。通过 sitemap 发现的孤儿页面依然没有权重流入,它需要真正的页面上的真正的内部链接。
如何修复孤儿页面
方案一:添加内部链接。 找到网站上相关的页面,从中自然地添加指向孤儿页面的链接。这是最好的办法——它把页面重新纳入网站结构。
方案二:加入导航。 如果页面足够重要,可以把它添加到分类页、侧边栏或底部导航中。
方案三:删除或重定向。 如果页面已经过时或不再相关,可以删除它(返回 410 状态码)或者把它重定向到相关页面。
如何发现孤儿页面
通过浏览网站是发现不了孤儿页面的——这恰恰就是问题所在。你需要一个爬虫工具来:
- 爬取每个内部链接,建立完整的网站地图
- 将爬取到的页面与你的 sitemap 进行对比
- 识别出 sitemap 中存在但从未通过链接发现的页面
- 报告零内部链接指向的页面
Kaitico 会将爬取数据与你的站点地图交叉比对,识别出那些存在但没有任何内部链接指向的孤儿页面。