Il y a deux semaines, nous résumions et commentions la déclaration de Matt Cutts concernant la fin du PageRank sculpting. Matt Cutts vient de publier un billet sur son blog où il commente encore le sujet. Voici une sélection de commentaires décryptés par nos soins :
L’attribut nofollow
Chez Google, les liens avec un attribut nofollow ne transmettent aucun PageRank, ni aucune autre forme de popularité à la page liée. L’ancre du lien n’est pas non plus associée à la page liée.
Quand Google a-t-il modifié le calcul de la répartition du PageRank en présence de liens en nofollow ?
Cela a été fait il y a plus d’un an.
Faire du PageRank sculpting est-il une mauvaise idée ?
Oui, c’est inefficace, voire contre-productif. Vous avez mieux à faire que de perdre votre temps de cette manière.
Comme je ne peux plus récupérer le PR des liens externes en nofollow, n’aurais-je pas intérêt à supprimer la possibilité de commenter sur mon blog ?
Cette approche est déconseillée. De la même manière que Google dégrade une page qui contient des liens vers des sites de mauvaise qualité, il valorise mieux une page qui fait des liens vers des sites de qualité.
Faut-il encore utiliser nofollow en interne ?
C’est une perte de temps.
Moralité
Ceux qui ont vendu leurs talents de sculpteurs de PageRank vendent du vent depuis au moins un an. Le référencement est un domaine où les croyances ont souvent pris le pas sur les observations rigoureuses. Il était temps que Google mette fin à une confusion qu’il avait indirectement provoquée.
Publié le 16 juin 2009
sous Google |
1 commentaire
La fin est proche pour les sculpteurs de PageRank.
Un mot d’abord sur le PageRank sculpting, l’activité favorite des sculpteurs de PageRank.
Tout référenceur sait qu’il est de son intérêt d’obtenir un maximum de liens de qualité vers son site et que la structure interne du site et la présence de liens vers l’extérieur peuvent influencer le PageRank et les autres mesures de popularité du site pour Google, mais les sculpteurs de PageRank ne se contentent pas d’obtenir des liens et de développer le site le plus agréable et le plus utile possible pour les internautes. Les sculpteurs de PageRank s’appliquent à donner à Google une vision tronquée de leur site, principalement en jouant avec des attributs “nofollow”.
Cette approche a toujours été fondamentalement opposée au comportement que Google recommendait aux webmasters dans ses règles de bonne pratique. Pourquoi ? Simplement parce que ce genre de sculpture du PR n’apporte rien à l’internaute et qu’elle induit Google en erreur.
Google n’aurait jamais dû introduire l’attribut “nofollow”. Nous l’avons écrit souvent. En se montrant compréhensif vis-à -vis du Pagerank sculpting, Google a passé un mauvais message aux référenceurs et cela ne pouvait durer.
Hier, Matt Cutts a annoncé un important changement de cap: dorénavant un lien en “nofollow” ne verra plus son PageRank reporté sur les autres liens de la page. Qu’est-ce que ça change ?
Maintenant :
- pour les liens internes, le PR du lien en “nofollow” est perdu pour le site; un lien interne en “nofollow” devient défavorable pour le référencement du site;
- pour les liens vers des sites tiers, le PR du lien en ‘nofollow” est perdu pour le site tiers qui aurait pu en bénéficier, mais sans contrepartie pour le site faisant le lien: celui qui met en “nofollow” un lien vers un autre site ne gagne plus rien dans l’opération.
Avant :
- pour les liens internes, le PR du lien en “nofollow” était récupéré par le site et aiguillé vers d’autres pages du site poussées par le référenceur;
- pour les liens vers des sites tiers, le PR du lien en ‘nofollow” était récupéré par le site et partagé entre les liens poussés par le référenceur “sculpteur de PR”; le site faisant le lien accroissait la moyenne du PR de ses pages en mettant des liens externes en “nofollow”.
Ceux qui confondaient PageRank sculpting et référencement ne seront pas heureux, mais c’est une excellente nouvelle pour ceux qui font des sites pour les internautes.
Publié le 3 juin 2009
sous Google |
2 commentaires
Google, Yahoo et MSN viennent d’introduire conjointement une nouvelle forme de la balise link:
<link rel="canonical" href="http://www.annuaire-info.com/referencement/link-rel-canonical/" />
Cette nouvelle balise permet au webmaster d’indiquer sous quelle URL exacte il souhaite qu’une page soit indexée, même si un contenu identique ou des variantes sont accessibles sous différentes adresses. Elle permet donc d’éliminer le “duplicate content”.
On sait que, dans beaucoup de cas, le “duplicate content” peut être évité au moyen d’une redirection 301, mais, ce n’est pas toujours possible et cette nouvelle balise sera alors très utile.
Des contenus identiques
Quand des pages ont des contenus identiques et que la redirection 301 n’est pas utilisable, l’emploi de link rel="canonical" est conseillé.
Des petites différences de contenu
link rel="canonical" peut être utilisé même s’il y a de petites différences entre plusieurs versions de la page. Cela sera très intéressant dans de nombreux cas:
- ID de session à éliminer
- identifiant d’affilié à éliminer de l’URL de la landing page
- version de la page triée différemment
- version de la page avec mots surlignés
Domaines et sous-domaines
link rel="canonical" peut indiquer une adresse dans un autre sous-domaine, mais pas une adresse dans un autre domaine.
Je ne peux donc pas utiliser:
<link rel="canonical" href="http://www.google.fr/link-rel-canonical/" />
Par contre, ceci ne poserait pas de problème:
<link rel="canonical" href="http://xyz.annuaire-info.com/referencement/link-rel-canonical/" />
ou
<link rel="canonical" href="http://annuaire-info.com/referencement/link-rel-canonical/" />
http et https
On peut parfaitement utiliser link rel="canonical" pour demander l’indexation des versions http au lieu des versions https des pages.
A ne pas faire
Cela pourrait marcher dans certains cas, mais ne jouez pas avec le feu:
- évitez les liens relatifs
- ne faites pas des chaînes de link rel="canonical"
- ne faites pas pointer link rel="canonical" vers une page en erreur 404 ou autre
Faut-il oublier les règles de bonne pratique ?
Non, efforcez-vous toujours d’utiliser partout la même URL pour une page donnée. Utiliser plusieurs URL pour un même contenu crée toujours une charge inutile provenant des robots des moteurs de recherche.
Faut-il oublier la redirection 301 ?
Certainement pas. Chaque fois que c’est possible, donnez la préférence à l’emploi de la redirection 301 plutôt qu’à link rel="canonical".
Sources
Publié le 17 février 2009
sous Google, Live Search, Yahoo! Search |
1 commentaire
Les robots de Yahoo qui visitent nos sites affichent généralement un user agent qui contient les mots Yahoo! Slurp. Par exemple:
Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearc
h/slurp)
Depuis juillet 2008, des robots de Yahoo visitent plus discrètement nos sites en se faisant passer pour un simple navigateur. Le user agent utilisé est:
Mozilla/5.0 (X11; U; Linux i686 (x86_64); en-US; rv:1.8.1.4) Gecko/20080721 BonEcho/2.0.0.4
Les adresses IP de ces robots sont les mêmes que celles des robots utilisant le user agent Yahoo! Slurp habituel. Ils lisent des pages HTML et les fichiers CSS en indiquant des referrers, comme le ferait un navigateur standard.
On peut penser que le but est la détection de certains types de spam, quoique l’efficacité de la méthode est probablement limitée puisque les adresses utilisées sont celles de Yahoo.
Publié le 21 août 2008
sous Robots, Yahoo! Search |
7 commentaires
Matt Cutts l’avait annoncée il y a 3 jours. A-Z-CREA nous a aimablement informé de son arrivée. La version “été 2008″ du PR est arrivée !
Nouveaux annuaires PR 7
(voir toute la liste des annuaires PR 7)
Anciennement PR 6 :
- http://www.indexa.fr/
- http://www.toile.com/
Nouveaux annuaires PR 6
(voir toute la liste des annuaires PR 6)
Anciennement PR 5 :
- http://www.breizhat.com/
- http://www.breizhoo.fr/
- http://www.juriguide.com/
- http://www.liensutiles.org/
- http://www.plaza.lu/
Nouveaux annuaires PR 5
(voir toute la liste des annuaires PR 5)
Anciennement PR 4 :
- http://www.agrimondial.com/
- http://www.bienvoyager.com/
- http://www.environnement-annuaire.net/
- http://www.fluxenet.fr/
- http://www.gratuit.org/
- http://www.gratuit-fr.com/
- http://www.info-chambres.net/
- http://www.kouik.ch/
- http://www.manager-go.com/
- http://www.manitoo.ch/
- http://www.pays-basque.eu/
- http://www.portail-express.com/
- http://www.russomania.com/
Anciennement PR 0 :
- http://annuaire.hitweb.org/
- http://www.bati-pass.com/
- http://www.directory.conua.com/
Et maintenant, c’est le moment de vérifier que vous avez soumis vos sites à ces annuaires qui montent !
Publié le 27 juillet 2008
sous Listes d'annuaires |
Aucun commentaire
Google offre la possibilité de restreindre les recherches aux pages d’un pays particulier. Ainsi on peut choisir “Pages: France” pour n’avoir que des sites français ou “Pages: Belgique” pour n’avoir que des sites belges dans les résultats de recherche. Cette option est très utile quand on recherche des informations spécifiques à un pays (lois nationales, procédures administratives).
La façon dont Google identifie la “nationalité” d’un site a été analysée par les référenceurs. Vous trouverez cette analyse expliquée dans notre article Google - Pages : France, géolocalisation d’un site web. Il semble que ce que nous avions écrit dans cet article n’est plus vrai dans tous les cas.
Il y a quelques semaines, nous avons constaté que des sites hébergés en Belgique avec un domaine en .com apparaissaient dans des recherches limitées aux “Pages: France” tout en continuant à être présents dans les “Pages: Belgique”.
Nous venons maintenant de découvir un phénomène un peu différent: des sites français (domaine en .fr) qui apparaissent dans les “Pages: Belgique” uniquement pour certaines requêtes.
Voici un exemple:
Le cinquième site de la liste est manifestement un site français.
C’est sans doute un bug, parce que quand un Belge sélectionne “Pages: Belgique” pour une recherche concernant les auto-écoles et le permis de conduire, la réponse à sa recherche ne sera certainement pas dans un site français.
Publié le 18 juillet 2008
sous Google |
1 commentaire
Vous avez été nombreux à le demander et ça y est: pour chaque annuaire présent dans nos listes d’annuaires, vous trouvez maintement le nombre de pages de l’annuaire qui sont indexées par Google.
Un nombre de pages indexées élevé est une mesure de l’importance de l’annuaire aux yeux de Google. C’est donc - parmi d’autres - un facteur d’efficacité pour le référencement de votre site.
Pages indexées du domaine ou pages indexées de l’annuaire
Il aurait été facile d’afficher le nombre de pages du domaine de l’annuaire. La commande site: de Google permet d’obtenir simplement le nombre de pages indexées dans un domaine donné. Malheureusement cette information n’est pas pertinente pour le référencement dans les annuaires. Ainsi un domaine qui héberge à la fois un annuaire, un forum et des pages de petites annonces serait apparu avec un nombre énorme de pages indexées, même si l’annuaire ne comptait que très peu de pages et qu’elles n’étaient pas indexées du tout.
Nous n’affichons donc pas le nombre de pages indexées du domaine, mais précisément le nombre de pages indexées de l’annuaire.
Méthode de calcul
Pour chaque annuaire, le nombre de pages indexées est calculé à partir d’une ou de plusieurs requêtes sur le moteur de recherche de Google. La commande site: est utilisée en combinaison avec d’autres commandes choisies en fonction de l’annuaire concerné. C’est le résultat de nombreuses heures d’analyse … bien loin d’un script qui fait tout tout seul.
En test
Cette nouvelle indication que vous trouvez exclusivement sur annuaire-info est le fruit d’un gros travail de compilation et de développement. Merci à tous ceux qui y ont collaboré.
Vos réactions nous sont indispensables pour perfectionner l’outil. Si vous avez des suggestions ou si vous découvrez des données inexactes, merci de poster un commentaire sur cette page.
Publié le 13 juin 2008
sous Listes d'annuaires |
4 commentaires
Depuis quelques semaines, mon excellent AVG Anti-Virus Free Edition (Grisoft) m’invitait à remplacer ma version 7.5 par la nouvelle version. Après le n-ième rappel, j’ai fini par me décider à télécharger et installer la nouvelle version 8.0. Le téléchargement et l’installation automatique se sont déroulés sans difficulté.
C’est seulement quand je suis retourné faire une recherche sur Google que je me suis intéressé de plus près aux nouvelles possibilités de mon anti-virus. Voici comment était l’écran:
Une petite étoile verte s’était ajoutée à côté de chaque résultat de recherche. Cette étoile indique que AVG Anti-Virus a visité la page et qu’elle ne contient pas de programme malveillant. Pas mal, n’est-ce pas ? … Oui, mais cette étoile verte se trouve aussi à côté de l’annonce AdWords à droite sur l’écran !
Et que se passe-t-il quand on survole un des liens ? Une fenêtre apparaît qui confirme qu’AVG vient d’aller visiter la page pour vous et qu’il n’y a trouvé aucune menace pour votre ordinateur:
Et comme cette vérification fonctionne aussi bien pour les liens commerciaux (AdWords) que pour les résultats naturels de la recherche, c’est un peu comme si vous aviez cliqué sur tous les liens présents sur la page - y compris les pubs. Dans ces conditions, on peut se demander si Google comptabilise ces clics comme des clics à facturer aux annonceurs AdWords ou pas.
Qu’en dit Grisoft ?
Grisoft, l’éditeur de AVG, nous indique que ceci est lié à l’utilisation du composant LinkScanner:
LinkScanner fonctionne avec Internet Explorer et Firefox. Il est composé de AVG Active Surf-Shield et de AVG Search-Shield. (…) AVG Search-Shield fait une évaluation en temps réel de la sécurité avec les résultats de recherche des moteurs de Google, Yahoo et MSN. L’action de AVG Search-Field s’applique aux résultats de recherche proprement dits et aux publicités. Une icône symbolise le niveau de sécurité de chaque site.
Détection des visites venant de l’antivirus AVG
Nos essais montrent que LinkScanner (AVG Search-Shield) utilise le user agent suivant:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;1813)
Seuls les hits automatiques de LinkScanner utilisent ce user agent. Les autres hits de votre navigateur utiliseront son user agent habituel.
Le user agent de LinkScanner semble être une tentative maladroite de dissimulation. Il se déguise en Internet Explorer 6 (même si votre Internet Explorer est une version 7), mais il se termine toujours par le code 1813 qui le rend facilement repérable.
Avec cette information, les annonceurs AdWords pourront facilement vérifier si Google comptabilise les visites provenant de ce user agent.
Nous n’avons vu aucune information ni de Grisoft, ni de Google ou Yahoo ou Microsoft, concernant ce problème potentiel. Nous conseillons aux annonceurs de monitorer le user agent de AVG Search-Shield (LinkScanner) tant que la situation n’aura pas été clarifiée.
Utilité de LinkScanner
Après réflexion, LinkScanner ne nous semble pas vraiment utile. En effet, pour chaque site dans les résultats, il ne teste jamais qu’une seule page; de même pour les annonces Google, seule la landing page est testée. Cela ne garantit donc pas que le deuxième ou troisième clic sur le même site ne nous mène pas à des pages malveillantes.
Désactiver AVG Search-Shield de LinkScanner
Pour désactiver AVG Search-Shield, double-cliquez l’icône AVG, puis double-cliquez sur LinkScanner et décochez la case “Enable AVG Search-Shield”, ensuite cliquez sur “Save changes”. Dès que ce changement sera effectif, un message indiquant que votre protection n’est plus complète apparaîtra, précisant que LinkScanner est désactivé. Ne vous laissez pas impressionner !
Publié le 29 mai 2008
sous AdWords, Robots |
Aucun commentaire
ErrorDocument 404, vous connaissez ? C’est une instruction du fichier .htaccess par laquelle on spécifie la page que doit afficher un serveur web en cas d’erreur 404, l’erreur 404 étant celle qui se produit quand un visiteur demande une page non existante.
Bonne utilisation de “ErrorDocument 404″
Voici un exemple typique d’utilisation:
ErrorDocument 404 /plan_du_site.html
Ainsi le visiteur qui se trompe en tapant l’adresse d’une page ou qui recherche une ancienne page disparue se voit afficher le plan du site.
Cette instruction ne perturbe pas les robots des moteurs de recherche qui eux reçoivent bien le code HTTP 404 quand ils demandent une adresse inexistante.
Mauvaise utilisation de “ErrorDocument 404″
Voici un exemple d’utilisation à éviter absolument:
ErrorDocument 404 http://www.mon_site.com/plan_du_site.html
Notez bien la différence. Ici l’adresse indiquée commence par “http://” et le visiteur qui se trompe d’adresse se voit rediriger vers la page avec le plan du site (redirection 302).
Quels sont les conséquences de cette redirection ? Premièrement, l’adresse affichée dans la barre d’adresse n’est plus l’adresse erronée, mais l’adresse de la redirection. Deuxièmement, et c’est bien plus important, les robots des moteurs de recherche ne voient plus qu’il y a une erreur d’adresse. Ils vont suivre la redirection et considérer que le plan du site est le contenu normal de l’adresse erronée. L’adresse erronée ne sera pas supprimée de l’index du moteur de recherche et toutes les pages erronées vont s’y retrouver avec le même contenu, celui de la page de la redirection, d’où un “duplicate content” massif et néfaste.
“ErrorDocument 404″ et redirection 301
Il est possible de transformer astucieusement l’instruction ErrorDocument 404 en redirection 301. Pour cela, il vous faudra utiliser cette ligne dans .htaccess :
ErrorDocument 404 /404vers301.php
Et votre fichier 404vers301.php devra contenir ce code:
<?php
header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.mon_site.com/plan_du_site.html");
exit();
?>
Ici aussi une redirection aura lieu vers la page avec le plan du site, mais, cette fois, ce sera une redirection 301. C’est sans importance pour les visiteurs, mais, pour les robots de Google et des autres moteurs, c’est tout différent. Pour eux, le code HTTP 301 signifie que l’adresse demandée est périmée et qu’ils doivent la remplacer dans leur index par l’adresse de la redirection. Dans notre exemple, ce sera l’adresse du plan du site. Cette adresse récupérera tout le poids des backlinks (PageRank, link juice,…) des adresses erronées.
Vous pouvez perfectionner cette technique en choisissant l’adresse de la redirection en fonction de l’adresse erronée en testant $_SERVER['REQUEST_URI'].
Publié le 10 mai 2008
sous Google, Live Search, Yahoo! Search |
1 commentaire
On dit que le PageRank est mort, qu’il ne sert plus à rien, que c’est un gadget marketing sans intérêt,… Mais, en attendant mieux, c’est plus fort que nous: chacun continue de lorgner sur ce fameux PR.
Fin avril, Google a mis à jour les valeurs publiées du PageRank. Nous avons également remis à jour les PR affichés dans nos listes d’annuaires. Rappelons que nous nous intéressons uniquement au PR de la page d’accueil de l’annuaire et non au PR de la page d’accueil du site.
Bravo à tous ceux qui ont progressé :
Nouvel annuaire en PR 7
(voir toute la liste des annuaires avec un PR 7)
Anciennement PR 6 :
- http://annuaire.pro/
Nouveaux annuaires en PR 6
(voir toute la liste des annuaires avec un PR 6)
Anciennement PR 5 :
- http://www.annuaire-du-net.net/
- http://www.recherche-web.com/
Nouveaux annuaires en PR 5
(voir toute la liste des annuaires avec un PR 5)
Anciennement PR 4 :
- http://fr.wedoo.com/
- http://univers-maison.mylinea.com/
- http://www.add.lu/
- http://www.e-komerco.fr/
- http://www.kagibi.net/
- http://www.luberonweb.com/annuaire/index.php3
- http://www.petanque-petanque.com/
- http://www.rapidmemo.be/
- http://www.referencez-vous.com/annuaire/
- http://www.relite.org/v2/annuaire/
- http://www.seek-blog.com/
- http://www.top-annuaire.com/
- http://www.visoterra.com/annuaire-voyage/
- http://www.web-immobilier.net/
Anciennement PR 3 :
- http://www.annuaires-environnement.com/
Anciennement PR 0 :
- http://www.objectif-suede.com/annuaire/index.php
Encore toutes nos félicitations à ces champions !
Publié le 3 mai 2008
sous Listes d'annuaires |
Aucun commentaire