annuaire-info

Bien plus qu'un annuaire d'annuaires !

L’URL canonique, selon Google

Définition de l’URL canonique (canonical URL)

Dans les forums américains consacrés au référencement, on entend parler d’URL canonique. Mon dictionnaire indique que canonique signifie conforme aux règles, à la norme.

Nous dirons qu’une adresse web est une URL canonique quand elle est l’adresse « officielle » d’une page web, celle qu’il est préférable d’utiliser pour accéder au contenu correspondant.

Les doublons (duplicate contents)

Détecter les doublons, c’est-à-dire les pages web à contenus identiques ou quasiment identiques fait partie des tâches d’un moteur de recherche. En effet, quand un internaute fait une recherche, il ne souhaite pas obtenir plusieurs fois le même résultat. Les moteurs de recherche se doivent donc de n’afficher qu’une seule fois un contenu dans les résultats.

Différentes techniques existent pour mesurer la similarité de pages web. Dans le contexte de l’URL canonique, nous nous intéressons seulement au cas où la similarité est totale : si exactement le même contenu est détecté à plusieurs adresses différentes, un moteur de recherche comme Google l’affichera une seule fois en mentionnant seulement l’adresse qu’il considérera être l’URL canonique.

Redirection et URL canonique

Si vous redirigez une adresse A vers une adresse B, la page affichée dans un navigateur sera la même, que l’internaute tape l’adresse A ou l’adresse B. Le problème d’URL canonique se pose donc aussi dans le cas des redirections.

Si les deux adresses font partie du même domaine, pour Google, l’URL canonique sera l’adresse faisant la redirection si c’est une redirection 302 et l’adresse de destination de la redirection si c’est une redirection 301 qui a été utilisée, sauf si celle-ci est beaucoup plus longue que l’adresse faisant la redirection.

Si les deux adresses appartiennent à des domaines différents, Google choisira toujours l’adresse de destination de la redirection, sauf si celle-ci est beaucoup plus longue que l’adresse faisant la redirection.

Google – comme les internautes – privilégie donc les adresses courtes et les adresses de destination des redirections.

URL canonique et poids des liens

Si les adresses A et B correspondent au même contenu et si l’URL canonique est l’adresse A, Google attribuera à l’URL canonique tout le poids des liens vers A et vers B. En un mot, tout le poids des liens entrants va à l’URL canonique.

Duplicate content non détecté par Google

Google ne détecte pas immédiatement tous les cas de duplicate content. Si Google ne s’aperçoit pas que plusieurs de vos pages ont le même contenu, cela ne vous est pas bénéfique, au contraire.

Supposons que vos pages A et B affichent le même contenu et qu’autant de liens entrants aillent vers A et que vers B. Le classement dans Google de la page A bénéficiera uniquement des liens pointant vers A et celui de la page B bénéficiera seulement des liens pointant vers B, alors que si Google détectait le duplicate content ou si vous faisiez une redirection, Google attribuerait l’ensemble des liens entrant de A et de B à l’URL canonique.

Règles de bonne gestion des URL

L’objectif est que vous gardiez le contrôle de la situation et que Google prenne comme URL canonique celle qui vous convient.

Règle 1. Avant tout, évitez autant que possible que deux adresses affichent le même contenu. Mais soyons réalistes, il n’est pas toujours possible d’éviter tout « duplicate content » et toute redirection.

Règle 2. Optez pour une redirection plutôt que d’avoir deux adresses non redirigées qui affichent le même contenu.

Règle 3. Choisissez de préférence la redirection 301 et veillez à ce que l’adresse de destination ne soit pas sensiblement plus longue que l’adresse faisant la redirection. L’URL canonique sera l’adresse de destination de la redirection.

Règle 4. Veillez à ce qu’un maximum de liens pointent directement vers l’URL canonique. Dans la mesure du possible, remplacez les liens existants pointant vers une autre adresse par des liens pointant vers l’URL canonique.



5 commentaires à propos de “L’URL canonique, selon Google”

  1. Une question me vient à l’esprit quant à l’utilisation des url relatives dans une page pour un site multidomaines (2 domaines différents avec des pages communes):

    Les règles ci-dessus s’appliquent-elles si l’on met un lien relatif dans une page commune à tous les domaines ? Ainsi, si l’on vient du site A, l’URL de la page commune comportera le nom de domaine A et un lien relatif placé sur cette page commune pointera vers une autre page commune avec le nom de domaine A.
    Idem pour le site B, les pages communes intervenant dans la navigation auront dans l’URL le nom de domaine B.

    Illustration navigation :

    http://www.siteA.com => http://www.siteA.com/page-communes/page1.asp (lien relatif href= »page2.asp »)=> http://www.siteA.com/page-communes/page2.asp

    http://www.siteB.com => http://www.siteB.com/page-communes/page1.asp (lien relatif href= »page2.asp »)=> http://www.siteB.com/page-communes/page2.asp

    => L’objectif souhaité est d’avoir de la visibilité sur les 2 domaines. Est-ce possible de cette façon ou est-on pénalisé en procédant de la sorte ?

    Merci de votre aide !

    Ecrit le 19 septembre 2008 à 9h16 par Liloute

  2. Ce que vous décrivez est bien du duplicate content. Peu importe la forme des liens. Vous avez des URL différentes avec un contenu identique.

    S’il ne s’agit que de quelques pages et qu’elles ne sont pas très importantes pour ces sites, ne vous inquiétez pas.

    S’il s’agit de pages importantes ou s’il s’agit de nombreuses pages, votre référencement n’est pas optimal. Il ne s’agit pas vraiment de pénalisation ou de sanction de Google, mais d’une non-optimisation, puisque les pages en question vont concourir une contre l’autre dans les classements de Google au lieu de combiner leurs poids respectifs.

    Si vous souhaitez partager la visibilité de ces pages entre les deux domaines, faites en sorte qu’elles soient différentes (textes réécrits sans en modifier le sens). Une autre approche serait d’adapter la structure des sites avec, par exemple, un site.fr et un site.be qui partagent des pages qui se trouvent sur un site.com.

    Ecrit le 19 septembre 2008 à 10h10 par Jean-Luc

  3. Oui,

    je peux confirmer que Google a bien restreint sa tolérance concernant le « duplicate content ». L’expérience me l’a prouvée, fin 2007. Et Google avait averti peu auparavant de son changement de politique à ce sujet.

    En effet, nous gérions un site « corporate » et durant toute la durée du développement de la nouvelle version du site, nous n’avions pas remarqué que nous utilisions les 2 extensions « fr » et « com » indifféremment dans les contenus même du site en cours d’élaboration… Les 2 domaines étaient actifs et une fois lancées, les 2 adresses, valides , pointaient vers le même contenu…

    Ca n’a pas trainé… Au bout d’un mois, plus de référence chez Google… Catastrophe ! Le client évidemment s’en rend compte et se retrouve à acheter du Adword en urgence pour tenter de son côté de rattraper le coup…

    C’est notre hébergeur qui nous révèle après enquête le problème…

    Redirection 301… et quelques jours plus tard, tout rentre dans l’ordre…

    Ouf ! Mais, que de sueurs froides !

    Ecrit le 12 novembre 2008 à 17h43 par Erwan Corre

  4. Pour info, la nouvelle version 2.9 de WordPress intègre une fonction d’URL canonique :
    http://wordpress.org/development/2009/12/wordpress-2-9/

    Ecrit le 20 décembre 2009 à 8h15 par J2M

  5. Pour l’url canonique, il faut bien penser avant de l’utiliser, surtout si on veut l’utiliser dans un site dynamique

    Ecrit le 24 septembre 2012 à 21h53 par said

Ajout de commentaire