你的关键词最大竞争对手可能就是……你自己
当网站上有两个或更多页面拥有相同或高度相似的内容时,Google 必须从中选一个。它可能选错,也可能觉得哪个都不值得给高排名,因为信号被分散了。
这就是重复内容的问题——远比大多数人意识到的要常见。
重复内容是怎么产生的
很少是故意的,通常的"罪魁祸首"包括:
- URL 参数 —
?sort=price、?page=2、?ref=email会生成新的 URL 但内容完全一样 - WWW 与非 WWW —
www.example.com/page和example.com/page提供相同的内容 - HTTP 与 HTTPS — 两个版本都能访问
- 末尾斜杠 —
/about和/about/被当作不同的 URL - 打印页面 —
/article和/article/print文字内容一模一样 - URL 中的 Session ID — 每个访客的同一个页面有一个不同的 URL
- 抄来的产品描述 — 制造商提供的描述被多个网站使用
对 SEO 的危害
排名被分散。 本来一个页面有 10 条外链,现在变成两个页面各 5 条。两个页面的排名都不如合并后的版本好。
Google 选错了版本。 排名的可能是带参数的 URL,而不是你干净的 canonical URL。用户体验大打折扣。
浪费爬取预算。 Google 花时间爬取同一内容的多个版本,而不是去发现新页面。
不会被惩罚——但也不会有奖励。 Google 在大多数情况下不会因为重复内容进行"惩罚",但它确实会稀释所有对排名有影响的信号。
如何修复
Canonical 标签。 用 rel="canonical" 将所有重复版本指向原始版本。这是最常见也最实用的修复方案。
301 重定向。 如果那些重复版本根本不应该存在,将它们永久重定向到 canonical 版本。
参数处理。 在 Google Search Console 中配置 URL 参数,或者更好的做法是直接阻止参数 URL 被索引。
保持内部链接一致。 始终链接到 URL 的 canonical 版本。不要在导航中链接到 /page?ref=sidebar。
如何发现重复内容
对于超过几十个页面的网站,手动检查几乎不可能。自动化审计应该能够:
- 跨所有已爬取 URL 比较页面内容
- 识别标题标签完全相同或高度相似的页面
- 检测同一页面的 URL 参数变体
- 检查重复页面是否缺少 canonical 标签
- 标记可通过多种 URL 模式访问的页面
Kaitico 在每次审计中都会检测重复内容和重复标题标签,展示哪些页面在互相竞争,以及哪里缺少 canonical 标签。