同一个内容,四个不同的 URL——Google 不知道该排哪个
这种事比你想象的更常见。产品页面存在于 /products/widget,但也存在于 /products/widget?color=blue、/products/widget?ref=newsletter,可能还有 /amp/products/widget。对人来说,这是同一个页面。对 Google 来说,这是四个互相竞争的独立页面。
Canonical 标签就是解决这个问题的。它是一个简单的 HTML 元素,告诉 Google:"这是原始版本,请忽略重复的。"
<link rel="canonical" href="https://example.com/products/widget" />
对 SEO 的影响
链接权重被分散。 如果五个 URL 展示相同的内容,外链和内链可能指向不同的版本。原本一个强页面变成五个弱页面。
爬取预算被浪费。 Google 爬取所有五个 URL,而不是把预算花在你真正独特的内容上。
排名变得不可预测。 Google 自己挑一个它觉得最好的版本——但那可能不是你想排名的那个。
什么时候需要 canonical 标签
- URL 参数 — 追踪代码、筛选器、排序选项
- HTTP vs HTTPS 版本 — 如果两者都可以访问
- WWW vs 非 WWW — 同一页面,不同子域名
- 末尾斜杠 —
/aboutvs/about/ - 内容联合 — 你的内容在另一个网站上重新发布
- 打印版或 AMP 版 — 同一内容的替代格式
常见的 canonical 错误
| 错误 | 为什么是问题 |
|---|---|
| 完全没有 canonical 标签 | Google 猜测,可能猜错 |
| Canonical 指向 404 页面 | 告诉 Google 你的首选页面不存在 |
| Canonical 指向被重定向的 URL | 发送关于真正目标的混乱信号 |
| 一个页面有多个 canonical 标签 | Google 可能全部忽略 |
| 分页页面的 canonical 都指向第一页 | 第 2、3 页等可能被取消索引 |
自引用 canonical
一个很多人跳过的最佳实践:每个页面都应该有一个指向自身的 canonical 标签。 即使没有重复版本。这是一种保险——如果有人创建了一个你没预料到的重复 URL(通过参数或镜像),canonical 已经就位了。
如何审计 canonical 标签
手动检查不可扩展。自动化审计应该:
- 找出缺少 canonical 标签的页面
- 检测指向 404 或重定向的 canonical
- 标记有多个 canonical 标签的页面
- 识别 canonical 链(A → B → C)
- 比较 canonical URL 与实际 URL 的不匹配
Kaitico 检查每个爬取页面的 canonical 标签,标记缺失、目标损坏和链式问题——给你一份清晰的修复清单。