annuaire-info

Bien plus qu'un annuaire d'annuaires !

1 2 3 ... Référencement, le blog de annuaire-info

Matt Cutts : vidéos 11 à 15

Les 10 premières mini-vidéos de Matt Cutts, sur Google et le référencement, avaient été mises en ligne en quelques jours. Le rythme actuel est un peu moins endiablé. On en est maintenant à la vidéo numéro 15.

Site disparu de Google, demande de réinclusion (vidéo 11)

Des maladresses ont été commises, Google les a détectées et a complètement exclu votre site des résultats de recherche. Que faire ? Attention, la procédure vient de changer. Le formulaire de demande de réinclusion se trouvait anciennement à l’adresse http://www.google.com/support/bin/request.py. Ce n’est plus le cas.

La demande de réinclusion se fait maintenant exclusivement au moyen de la console Sitemaps. Vous y trouverez un lien Demande de réinclusion. Suivez scrupuleusement les instructions données. Google attend de vous que vous donniez une explication détaillée de l’ »erreur commise » et surtout que vous le convainquiez que vous avez fait le nécessaire pour éliminer définitivement cette « infraction ». L’emploi de textes cachés, de pages satellites ou de redirection destinées à tromper les moteurs de recherche sont des exemples de ces « infractions ».

Conferences et exposition SES 2006 (San Jose, Californie) (vidéo 12)

Du 7 au 10 août 2006 se tenaient une exposition et un important cycle de conférences consacrés au référencement avec la participation de Google et des autres acteurs majeurs. Présentation du programme et recommendations pour optimiser l’organisation de son sac à dos pour la visite (casse-croûte, boissons, ordi portable,…).

 

Matt Cutts
  

Google Webmaster Tools, anciennement Sitemaps (vidéo 13)

Le 4 août 2006, Sitemaps a été rebaptisé Google Webmaster Tools. Les fonctionnalités ont été largement étendues. Les informations actuellement disponibles sont :

  • possibilité de spécifier quel est votre nom de domaine « officiel », avec ou sans www. Ceci s’applique aux sites qui affichent le même contenu sous http://www.nom-de-domaine.com et sous http://nom-de-domaine.com et qui ont des liens vers les deux types d’adresses. 
  • test de robots.txt. Vous êtes ainsi assuré que Google lit et comprend votre fichier robots.txt.
  • informations sur certaines pénalisations infligées par Google à votre site (par exemple, pour du texte caché)
  • problèmes rencontrés par Googlebot dans l’exploration du site

Résumé des annonces et événements marquant pendant SES 2006 (vidéo 14)

Matt Cutts salue l’annonce de Yahoo! Search Builder, un moteur de recherche Yahoo personnalisable et gratuit pour votre site. Il signale également que Yahoo! Site Explorer prévoit maintenant un processus d’authentification, ce qui permettra d’ajouter de nouvelles fonctions.

Selon Matt Cutts, chez Google, ce sont l’extension et le changement de dénomination de Sitemaps en Google Webmaster Tools et l’ouverture du nouveau blog « webmasters » qui font la une.

Matt conclut en soulignant que l’événement dont on parlait le plus pendant SES, c’était la diffusion plus ou moins accidentelle par AOL des informations sur les recherches effectuées par un grand nombre de ses clients.

A propos des data centers (vidéo 15)

Rappelons d’abord que les index de Google sont mis à jour de manière continue. Des mises à jour de grande envergure ont eu lieu les 27 juin, 27 juillet et 17 août.

Big Daddy consistait en une importante rénovation de l’infrastructure logicielle de l’index principal. Elle s’est achevée en février 2006. Ensuite l’infrastructure logicielle de l’index des « Résultats complémentaires » a été entièrement rénovée à son tour.

Mais ce qui est important pour votre positionnement, ce ne sont pas les data centers. Une adresse IP donnée correspond souvent à un data center particulier, mais ce n’est pas toujours le cas. Ne perdez pas trop de temps à les éplucher dans tous les sens, répète Matt Cutts. Concentrez-vous sur :

  • le développement du contenu de votre site
  • la recherche de nouveaux sujets, de nouvelles niches
  • la recherche de backlinks de qualité
  • l’analyse de vos fichiers logs et du comportement de vos visiteurs

Conclusion de Matt : Le meilleur référenceur est celui qui sait s’adapter.

Publié le 30 août 2006 sous Google | 3 commentaires

 

Comment apprivoiser Googlebot

Dans le nouveau blog Google destiné aux webmasters, Vanessa Fox fait quelques recommendations intéressantes pour éviter les mauvaises surprises et améliorer l’efficacité des visites du robot de Google.

Si mon site est momentanément indisponible, quel code HTTP doit-il renvoyer à Googlebot ?

Choisissez le code 503: Googlebot sait que ce code signifie « service indisponible ». Il convient parfaitement pour une interruption pour maintenance ou pour une mise à jour.

Que faire si Googlebot explore mon site trop rapidement ?

Utilisez le formulaire Googlebot et la charge sur mes serveurs. Google expérimente une nouvelle technique pour corriger ce genre de problèmes.

Est-il préférable d’utiliser la balise META « robots » ou le fichier « robots.txt » ?

Les deux techniques ont des effets différents et elles sont complémentaires. Pour plus d’informations, voyez robots.txt – contenu du fichier et Balise META « robots ».

Si robots.txt contient des instructions destinées à tous les robots et aussi des instructions spécifiques pour Googlebot, quelles instructions seront suivies par Googlebot ?

Googlebot ne respectera que les instructions spécifiques. Cela est conforme à la norme robots.txt.

Exemple :

User-agent: *
Disallow: /admin/

User-agent: googlebot
Disallow: /photos/

Ce fichier robots.txt interdit uniquement la visite du répertoire /photos/ à Googlebot. Aux autres robots, il interdit uniquement la visite du répertoire /admin/.

Que faire si je souhaite que Google n’utilise pas le titre et la description de DMOZ dans les résultats de recherche ?

Ajoutez cette ligne dans les pages concernées :

<meta name= »GOOGLEBOT » content= »NOODP »>

Ces questions et réponses représentent notre sélection et adpatation des informations publiées par Vanessa Fox.

Publié le 23 août 2006 sous Google, Robots | 2 commentaires

 

AdSense pour les recherches: nouveau style

AdSense pour les recherches est le programme de Google AdSense qui vous permet de proposer un champ de recherche Google sur votre site. Jusqu’à présent, les résultats de recherche étaient obligatoirement affichés dans une page entièrement contrôlée par Google. Cette page de résultats n’était pas très jolie (loin de là) et votre visiteur quittait ainsi l’environnement de votre site.

Grande nouveauté : vous pouvez maintenant afficher les résultats de recherche dans votre site. Pour vous permettre de faire connaissance avec cette nouvelle possibilité, pendant une période limitée, nous avons ajouté un champ de recherche Google en haut des pages du blog. Les résultats de recherche s’affichaient comme ceci :

AdSense pour les recherches
 
Première impression : pas mal du tout. En tout cas, un grand progrès !

 

Publié le 15 août 2006 sous AdSense | 2 commentaires

 

Matt Cutts: vidéos 1 à 10

Matt Cutts, ingénieur et porte-parole officiellement non officiel de Google, a profité du week-end pour mettre en ligne 10 mini-vidéos sur son blog. Entre les bons mots et les généralités, nous avons recueilli quelques informations et confirmations concrètes.

Googleguy
Validation W3C   

  • la conformité W3C n’est pas un critère pris en compte par Google (car énormément de pages avec un contenu de qualité ne sont pas conformes)
  • pour Google, <b> et <strong> sont équivalents
  • pour Google, <i> et <em> sont équivalents

Cloaking

Définition de Google : le cloaking consiste à présenter aux moteurs de recherche un contenu différent de celui présenté aux internautes.

  • la géolocalisation (présentation d’un contenu différent selon la localisation de l’internaute) n’est pas du cloaking
  • … sauf si on localise spécialement Googlebot !
  • si un site d’e-commerce avec des URL longues et compliquées les remplace par des URL simples uniquement pour Googlebot (donc non accessibles aux internautes), c’est du cloaking.
  • des tests de pages en variant aléatoirement le contenu entre des versions A et B pourraient être pris pour du cloaking par Googlebot. A déconseiller !

Doublons (duplicate content)

Les algorithmes de Google détectent le duplicate content à différents stades du processus d’indexation. Les doublons exacts sont détectés, mais aussi différents types de similarités partielles.

  • page HTML et sa version imprimable : pas de problème
  • page HTML et version .doc correspondante : pas de problème
  • même contenu traduit dans des langues différentes : pas de problème
  • versions nationales d’une page, mais dans la même langue : similarité importante

La similarité de deux pages peut entraîner le déclassement d’une des pages au profit de l’autre et éventuellement une pénalisation.

Préférez toujours les URL réécrites aux URL avec paramètres !

  • URL avec ID de session : à éviter absolument
  • URL avec code d’identification de produit (du style MC6789B12) : à éviter
  • URL avec plus de 2 paramètres : à éviter
  • URL avec 1 ou 2 paramètres : acceptable pour Google, mais déconseillé pour d’autres moteurs de recherche

Pas de faveur pour les .gov ou les .asso.fr

Aucun type de domaine n’est favorisé. Le fait est que de nombreux sites gouvernementaux (.gov aux Etats-Unis) sont des sites de qualité qui se retrouvent donc automatiquement bien classés, mais ils le seraient aussi bien avec un autre top level domain.

Les résultats complémentaires

  • le nombre de résultats d’une recherche affichant des résultats complémentaires est fantaisiste
  • les pages en résultats complémentaires sont crawlées beaucoup moins souvent que celles de l’index principal
  • … d’où des dates pas toujours très fraîches, pour certaines caches de résultats complémentaires
  • La fraîcheur des résultats et le rythme des crawls devraient s’améliorer durant cet été !

Ne perdez pas votre temps à :

  • essayer de comprendre l’organisation et le fonctionnement des data centers.
  • essayer de comprendre la logique des mises à jour des index, des mises à jours des algo, des mises à jour des données.

Consacrez plutôt votre temps à :

  • vous assurer que l’ensemble de votre site est accessible aux robots (à tester avec un navigateur « texte »).
  • créer du « bon contenu« .
  • faire connaître votre site et à le rendre attractif.

Et voilà ! Il n’y a plus qu’à mettre tout cela en pratique.

Voici les vidéos en anglais : 1 2 3 4 5 6 7 8 9 10

 

Publié le 3 août 2006 sous Google | 2 commentaires

AdSense pour les recherches disponible en arabe

???? ? ???? ? ?????

AdSense pour les recherches est maintenant disponible en langue arabe. C’est une opportunité d’étendre les services des sites qui s’adressent aux internautes des pays du Maghreb. L’option est accessible dans votre console AdSense.

Publié le 1 août 2006 sous AdSense | Aucun commentaire