L’URL canonique, selon Google
Définition de l’URL canonique (canonical URL)
Dans les forums américains consacrés au référencement, on entend parler d’URL canonique. Mon dictionnaire indique que canonique signifie conforme aux règles, à la norme.
Nous dirons qu’une adresse web est une URL canonique quand elle est l’adresse “officielle” d’une page web, celle qu’il est préférable d’utiliser pour accéder au contenu correspondant.
Les doublons (duplicate contents)
Détecter les doublons, c’est-à -dire les pages web à contenus identiques ou quasiment identiques fait partie des tâches d’un moteur de recherche. En effet, quand un internaute fait une recherche, il ne souhaite pas obtenir plusieurs fois le même résultat. Les moteurs de recherche se doivent donc de n’afficher qu’une seule fois un contenu dans les résultats.
Différentes techniques existent pour mesurer la similarité de pages web. Dans le contexte de l’URL canonique, nous nous intéressons seulement au cas où la similarité est totale : si exactement le même contenu est détecté à plusieurs adresses différentes, un moteur de recherche comme Google l’affichera une seule fois en mentionnant seulement l’adresse qu’il considérera être l’URL canonique.
Redirection et URL canonique
Si vous redirigez une adresse A vers une adresse B, la page affichée dans un navigateur sera la même, que l’internaute tape l’adresse A ou l’adresse B. Le problème d’URL canonique se pose donc aussi dans le cas des redirections.
Si les deux adresses font partie du même domaine, pour Google, l’URL canonique sera l’adresse faisant la redirection si c’est une redirection 302 et l’adresse de destination de la redirection si c’est une redirection 301 qui a été utilisée, sauf si celle-ci est beaucoup plus longue que l’adresse faisant la redirection.
Si les deux adresses appartiennent à des domaines différents, Google choisira toujours l’adresse de destination de la redirection, sauf si celle-ci est beaucoup plus longue que l’adresse faisant la redirection.
Google - comme les internautes - privilégie donc les adresses courtes et les adresses de destination des redirections.
URL canonique et poids des liens
Si les adresses A et B correspondent au même contenu et si l’URL canonique est l’adresse A, Google attribuera à l’URL canonique tout le poids des liens vers A et vers B. En un mot, tout le poids des liens entrants va à l’URL canonique.
Duplicate content non détecté par Google
Google ne détecte pas immédiatement tous les cas de duplicate content. Si Google ne s’aperçoit pas que plusieurs de vos pages ont le même contenu, cela ne vous est pas bénéfique, au contraire.
Supposons que vos pages A et B affichent le même contenu et qu’autant de liens entrants aillent vers A et que vers B. Le classement dans Google de la page A bénéficiera uniquement des liens pointant vers A et celui de la page B bénéficiera seulement des liens pointant vers B, alors que si Google détectait le duplicate content ou si vous faisiez une redirection, Google attribuerait l’ensemble des liens entrant de A et de B à l’URL canonique.
Règles de bonne gestion des URL
L’objectif est que vous gardiez le contrôle de la situation et que Google prenne comme URL canonique celle qui vous convient.
Règle 1. Avant tout, évitez autant que possible que deux adresses affichent le même contenu. Mais soyons réalistes, il n’est pas toujours possible d’éviter tout “duplicate content” et toute redirection.
Règle 2. Optez pour une redirection plutôt que d’avoir deux adresses non redirigées qui affichent le même contenu.
Règle 3. Choisissez de préférence la redirection 301 et veillez à ce que l’adresse de destination ne soit pas sensiblement plus longue que l’adresse faisant la redirection. L’URL canonique sera l’adresse de destination de la redirection.
Règle 4. Veillez à ce qu’un maximum de liens pointent directement vers l’URL canonique. Dans la mesure du possible, remplacez les liens existants pointant vers une autre adresse par des liens pointant vers l’URL canonique.
