logo annuaire-info annuaire-info est un service de recherche et de sélection d'annuaires  

Protocole d'Exclusion des Robots



Le Protocole d'Exclusion des Robots (Robots Exclusion Protocol) définit le format du fichier robots.txt et de la balise META "robots". Il a été approuvé le 30 juin 1994.

Il s'agit de deux techniques complémentaires de communication entre le gestionnaire d'un site web et les robots qui le visitent.

Le fichier robots.txt consiste en une série d'instructions destinées aux robots du web. Le fichier pourra comprendre une série d'instructions destinées à tous les robots et des instructions spécifiques pour l'un ou l'autre robot particulier.

Grâce à ce fichier, le webmaster peut demander aux robots de ne pas visiter certaines adresses de son site. Il s'agit bien d'une demande et non d'un dispositif qui rendrait la visite du robot techniquement impossible.

La balise META "robots" est une ligne de code HTML à placer dans le code source d'une page. Elle indique aux robots les restrictions quant à l'usage qu'ils peuvent faire de la page. Ici aussi, il s'agit d'un mécanisme qui suppose la collaboration du moteur de recherche.
 

Tout savoir sur robots.txt et balise META "robots"


robots.txt, les instructions conformes au Protocole d'Exclusion des Robots

Balise META "robots", les directives conformes au Protocole d'Exclusion des Robots

Googlebot (robot de Google), robots.txt et META "robots", extensions et particularités

MSNBot (robot de MSN Search), robots.txt et META "robots", extensions et particularités

Slurp (robot de Yahoo! Search), robots.txt et META "robots", extensions et particularités

 
                     


FAQ - Questions fréquentes


1. A quoi sert le fichier robots.txt ?

2. A quoi ne sert pas le fichier robots.txt ?

3. Où placer le fichier robots.txt ?

4. Pourquoi mes statistiques indiquent-elles des erreurs 404 pour robots.txt ?

5. Un fichier robots.txt vide est-il préférable à l'absence de robots.txt ?

6. Pourquoi pas robot.txt ou Robots.txt ?

7. robots.txt permet-il d'empêcher l'apparition d'une page dans les résultats d'un moteur de recherche ?

8. La balise META "robots" permet-elle de supprimer une page d'un moteur de recherche ?

9. Dans quel délai un changement dans robots.txt est-il pris en compte ?

10. Dans quel délai un changement dans une balise META "robots" est-il pris en compte ?

11. Comment protéger les fichiers sensibles ?

12. Puis-je utiliser robots.txt et la balise META "robots" sur un même site ?
 

L'Encyclopédie des Robots


L'Encyclopédie des Robots du Web est un répertoire de plusieurs dizaines de robots (spiders,crawlers, probes,...) qui circulent sur le web francophone. L'encyclopédie contient des informations qui vous permettent de décider en connaissance de cause si le robot est le bienvenu ou non sur votre site.

Pour la plupart des robots, elle contient également le User Agent à placer dans le fichier robots.txt.




 

      
L'intro
TOUS LES ANNUAIRES
Classement alphabétique des titres
TOUS LES ANNUAIRES
Classement alphabétique des noms de domaine
TOUS LES ANNUAIRES
Classement selon le nombre de liens
Documentation
et outils
Charte de qualité
Contact