annuaire-info

Bien plus qu'un annuaire d'annuaires !

Balise META "robots"

La balise META « robots » est utile pour gérer l’indexation ou plutôt la non-indexation de certaines pages web.

<META NAME="robots" CONTENT="noindex">

Cette balise demande aux moteurs de recherche de ne pas indexer la page, c’est-à-dire de ne jamais la faire figurer dans les résultats de recherche.

La balise <META NAME="robots" CONTENT="index"> qui autorise l’indexation est inutile puisque l’indexation est autorisée par défaut.

<META NAME="robots" CONTENT="nofollow">

Cette balise demande aux moteurs de recherche de ne pas suivre les liens présents dans la page. Encore faut-il s’entendre sur ce que signifie « suivre les liens ».

Officiellement, les moteurs de recherche incluent ces liens dans la liste des liens dont l’indexation est autorisée, mais ils n’accordent aucun poids (ou PageRank ou « link juice« ) à la présence des liens dans la page.

La balise <META NAME="robots" CONTENT="follow"> qui autorise le suivi des liens est inutile puisque ce « suivi » est autorisé par défaut.

<META NAME="robots" CONTENT="noindex, nofollow">

Cette balise combine les effets du « noindex » et du « nofollow ». Elle est exactement équivalente à <META NAME="robots" CONTENT="none"> dont l’emploi peut prêter à confusion.

Il est préférable aussi d’éviter d’utiliser plusieurs balises META « robots » comme ceci :
<META NAME="robots" CONTENT="noindex">
<META NAME="robots" CONTENT="nofollow">

Balises pour un moteur de recherche particulier

Les mêmes sortes de balises peuvent être utlisées pour donner des instructions à un moteur de recherche particulier au lieu que ce soit pour tous les moteurs de recherche :

  • <META NAME="Googlebot" CONTENT="noindex"> ne concerne que Google.
  • <META NAME="Slurp" CONTENT="noindex"> ne concerne que Yahoo.
  • <META NAME="msnbot" CONTENT="noindex"> ne concerne que les moteurs de recherche de Microsoft.

Quelques remarques générales

Les balises META se placent toujours dans la première partie du code source, c’est-à-dire entre les balises <HEAD> et </HEAD>.

Certains moteurs de recherche ne tiennent pas compte de la balise META « robots ». C’est notamment le cas de la Wayback Machine de Internet Archive.

La balise META « robots » est totalement insensible à la casse. L’emploi de majuscules ou de minuscules est donc sans effet particulier.

Si plusieurs valeurs sont spécifiées pour CONTENT, elles doivent être séparées par une virgule, éventuellement suivie d’une ou plusieurs espaces.

La balise <META NAME="robots" CONTENT="all"> autorise l’indexation et le suivi des liens. Elle est inutile puisque l’indexation et le « suivi » sont autorisés par défaut.

Si vous interdisez une page dans le fichier robots.txt, elle ne sera pas visitée par les robots. Le contenu d’une éventuelle balise META « robots » dans cette page ne sera donc jamais lu par les robots des moteurs de recherche. Ils ne pourront donc pas en tenir compte.

<META NAME="robots" CONTENT="noarchive">

Cette balise demande aux moteurs de recherche de ne jamais afficher de « cache ». Tout moteur de recherche doit alors garder secret le contenu de la page tel qu’il l’a archivée. Cette balise n’interdit pas aux moteurs de recherche d’utliser autrement le contenu de la page, ni l’apparition de la page dans les résultats de recherche.

Cette balise est utilisée pour forcer les visiteurs à aller sur le site lui-même, plutôt que sur une version mise en cache du site. Elle est parfois utilisée pour dissimuler du cloaking (technique qui montre une page différente aux moteurs de recherche et aux visiteurs).

<META NAME="robots" CONTENT="nosnippet">

Cette balise demande aux moteurs de recherche de ne pas afficher de « snippet » dans les résultats de recherche. Le « snippet » est la description ou le court extrait de la page qui est affiché dans les résultats de recherche.

Pour Google, cette balise interdit également l’affichage de « cache ».

<META NAME="robots" CONTENT="noodp">

Cette balise demande aux moteurs de recherche de ne pas utiliser le titre et la description provenant de DMOZ dans les résultats de recherche. Elle s’adresse aux moteurs de recherche de Google, Yahoo et Microsoft.

<META NAME="robots" CONTENT="noydir">

Cette balise demande aux moteurs de recherche de ne pas utiliser le titre et la description provenant de l’annuaire Yahoo Directory dans les résultats de recherche. Elle s’adresse au moteur de recherche de Yahoo.

FAQ robots.txt et balise META "robots"

Vous avez d’autres questions concernant la balise META « robots » ou robots.txt ? Consultez la FAQ robots.txt et balise META « robots » ou ajoutez-y votre question.



2 commentaires à propos de “Balise META "robots"”

  1. Merci beaucoup de toutes ses informations. Le savoir ne vaut que si il est partagé.
    Cordialement
    Moëz Abdellah

    Ecrit le 27 octobre 2008 à 16h12 par moezo

  2. Bonjour peut on mettre 3 attributs dans la balise meta robots à savoir : index, follow et noodp ?

    Par avance merci

    Dédé

    Ecrit le 28 avril 2010 à 9h32 par Dédé

Ajout de commentaire