Votre plus gros concurrent sur vos propres mots-clés pourrait bien être… vous-même
Quand deux pages ou plus de votre site ont un contenu identique ou très similaire, Google doit en choisir une. Il pourrait choisir la mauvaise. Ou il pourrait décider qu'aucune ne mérite un bon classement parce que le signal est dilué.
C'est le problème du contenu dupliqué — et c'est bien plus fréquent que la plupart des gens ne le pensent.
Comment le contenu dupliqué apparaît
C'est rarement intentionnel. Les coupables habituels :
- Les paramètres d'URL —
?sort=price,?page=2,?ref=emailcréent de nouvelles URL avec le même contenu - WWW vs sans WWW —
www.example.com/pageetexample.com/pageservant un contenu identique - HTTP vs HTTPS — les deux versions accessibles
- Les slashs finaux —
/aboutet/about/comme URL distinctes - Les pages d'impression —
/articleet/article/printavec le même texte - Les identifiants de session dans les URL — chaque visiteur obtient une URL unique pour la même page
- Les descriptions produit copiées — des descriptions fabricant utilisées sur plusieurs sites
Les dégâts sur le SEO
Le classement se divise. Au lieu d'une page avec 10 backlinks, vous avez deux pages avec 5 chacune. Aucune ne se positionne aussi bien que la version consolidée.
Google choisit la mauvaise version. La page qui se positionne pourrait être l'URL bourrée de paramètres au lieu de votre belle URL canonique. Pas idéal pour l'expérience utilisateur.
Gaspillage de budget de crawl. Google passe du temps à crawler plusieurs versions du même contenu au lieu de découvrir de nouvelles pages.
Pas de pénalité — mais pas de récompense non plus. Google ne « pénalise » pas le contenu dupliqué dans la plupart des cas. Mais il dilue tout ce qui compte pour le classement.
Comment corriger
Les balises canonical. Pointez toutes les versions dupliquées vers l'originale avec rel="canonical". C'est la solution la plus courante et la plus pratique.
Les redirections 301. Si les doublons ne devraient pas exister du tout, redirigez-les de manière permanente vers la version canonique.
La gestion des paramètres. Configurez les paramètres d'URL dans Google Search Console, ou mieux encore, empêchez les URL à paramètres d'être indexables.
Un maillage interne cohérent. Liez toujours vers la version canonique d'une URL. Ne liez pas vers /page?ref=sidebar depuis votre navigation.
Comment trouver le contenu dupliqué
Repérer les doublons manuellement est quasiment impossible sur un site de plus de quelques dizaines de pages. Un audit automatisé devrait :
- Comparer le contenu des pages sur toutes les URL crawlées
- Identifier les pages avec des balises title identiques ou quasi identiques
- Détecter les variations de paramètres d'URL pour une même page
- Vérifier l'absence de balises canonical sur les pages dupliquées
- Signaler les pages accessibles via plusieurs schémas d'URL
Kaitico détecte le contenu dupliqué et les balises title en double lors de chaque audit, en montrant quelles pages se font concurrence et où les balises canonical manquent.