Matt Cutts dit tout !
Eric Enge de Stone Temple Consulting a eu la chance (et le talent) d’interviewer Matt Cutts de Google. L’interview publiée le 8 octobre est simplement intitulée Eric Enge Interviews Google’s Matt Cutts. Ensemble ils ont fait le point sur les diverses techniques de liens, sur le spam et leur impact sur le référencement. Nous en avons résumé les points les plus importants. C’est Matt Cutts qui parle:
- un lien HTML direct, c’est toujours le plus simple. A utiliser chaque fois que c’est possible.
- Google suit généralement bien les redirections 301, 302, META Refresh et JavaScript
- Google prend généralement en compte tous ces types de liens pour le calcul du PageRank et du « Link Juice » (si vous préférez l’appeler ainsi)
- robots.txt permet de dire à un robot de ne pas crawler une page ou un groupe de pages. Il n’interdit pas l’indexation.
- Une URL dont la visite est interdite par robots.txt peut être indexée et avoir un PageRank. Elle peut donc apparaître dans les résultats de recherche avec un titre et une description venant de DMOZ.
- La balise META « robots » avec un « noindex » interdit l’indexation de la page. Cette page sera visitée par le robot, mais elle n’apparaîtra pas dans les résultats de recherche.
- Une page contenant une balise META « robots » avec un « noindex » peut avoir un PageRank et le transmettre aux liens qu’elle contient (le « noindex » n’est pas nécessairement accompagné d’un « nofollow »).
- La balise META « robots » avec un « nofollow » a pour effet que tous les liens de la page perdent toute effet pour le référencement.
- Une page contenant une balise META « robots » avec un « nofollow » ne contient pas nécessairement un « noindex ». Elle pourra donc être indexée et apparaître dans les résultats de recherche.
- Le « nofollow » associé à un lien particulier a la même signification pour ce lien que la balise META « robots » avec « nofollow » a pour l’ensemble des liens de la page où elle apparaît.
- robots.txt et nofollow sont deux moyens légitimes pour gérer et optimiser le référencement de vos URL.
- Quand deux pages présentent des contenus similaires ou identiques, faites en sorte qu’un maximum de liens pointent vers la « bonne » adresse (celle que vous voulez référencer) et qu’il n’y ait pratiquement pas de liens vers la « mauvaise » adresse. Dans bien des cas, cela suffit pour éviter les problèmes de duplicate content. N’utilisez la META « robots » avec « noindex » que si la technique précédente ne fontionne pas.
- L’outil de suppression des URL des outils pour webmaster peut aussi être utilisé pour supprimer une page de l’index de Google.
- Il n’y a pas que les liens qui interviennent pour déterminer la valeur, la qualité d’une URL. Google n’indique pas quels autres signaux il utilise pour valoriser les URL (pas de réponse précise donc concernant le rôle du taux de rebond, de Google Analytics,…).
- Certains textes sont cachés pour de bonnes raisons; d’autres le sont pour tromper les moteurs de recherche. Google utilise différentes combinaisons d’algorithmes et des interventions humaines pour analyser les textes cachés.
- Des cas de spam publiés sur des blogs de référencement populaires ont reçu un traitement prioritaire de la part de Google.
- La possibilité de signaler un spam à travers les outils pour webmaster sert, avant tout, à améliorer les algorithmes, mais il arrive parfois que des actions spécifiques soient prises à l’égard des sites dénoncés.
- Pour les textes cachés et d’autres cas de spam, Google prévient souvent le webmaster par e-mail. Les sanctions prises sont souvent levées rapidement (30 jours) si le spam est enlevé immédiatement.
- Utilisez votre créativité pour développer un contenu original de qualité. Ce sera bien plus profitable que de l’utiliser à tenter de flouer les moteurs de recherche !
- Sur les bons moteurs de recherche, il est devenu rare d’avoir une page de résultats complètement spammée. Des progrès importants ont été faits dans la lutte contre le spam des moteurs, mais les astuces utilisées changent chaque jour. Cette lutte n’est jamais finie et Google veut constamment améliorer la qualité de ses résultats.

Je comprends pourquoi le Spam Report ne fonctionne pas vraiment.
ça me conforte dans l’idée de la quasi inutilité de ce truc.
Ecrit le 12 octobre 2007 à 12h46 par Tom
Merci pour cette traduction.
Ecrit le 12 octobre 2007 à 13h40 par Kmenslow
Justement non, il sert mais à long terme.
Ecrit le 12 octobre 2007 à 13h52 par Gluck
J’ai tout de même beaucoup de mal à croire que les redirections par meta refresh et Javasript transmettent le PR, même de façon modérée.
Il me semblait justement que Matt recommandait d’encoder les liens textes vendus en direct à des partenaires avec ce type de redirections pour éviter d’influencer le PR et l’index de Google…
Ecrit le 12 octobre 2007 à 16h20 par Voyageur du Net
Pour les liens commerciaux, Matt Cutts recommande d’ajouter un « nofollow » ou de passer par une redirection sur une page dont la visite est interdite par robots.txt.
Hidden links (Matt Cutts) : « If you want to sell a link, you should at least provide machine-readable disclosure for paid links by making your link in a way that doesn’t affect search engines. There’s a ton of ways to do that. For example, you could make a paid link go through a redirect where the redirect url is robot’ed out using robots.txt. You could also use the rel=nofollow attribute.«
Ecrit le 12 octobre 2007 à 16h30 par Jean-Luc
Un interview de Matt cutts n’a aucun interet si ce n’est de repeter encore et toujours les memes choses. Rien n’est prevu pour avancer (trop de risques de la part de GG et de ses partenaires privilegies). La seule information plausible que j’ai trouvé est le fait que l’underscore sera bientot reconnu comme un separateur de mot … rien de plus … opaque GG est opaque il restera
Ecrit le 12 octobre 2007 à 18h06 par raljx
Merci pour cet excellent article. Obtenir des confirmations et informations de la part de Google est toujours très intéressant et rassurant.
Ecrit le 12 octobre 2007 à 21h50 par Aurélien
Je trouve toujours trés étonnant la recommandation de « Utilisez votre créativité pour développer un contenu original de qualité » de la part d’une société qui ne propose aucun contenu propre et qui au contraire, utilise à son profit des contenus tiers ! Mais c’est vrais que Google est trés créatif … en matière de rachat d’idées et de technologie.
Ecrit le 13 octobre 2007 à 22h04 par themask
question bête ?
« robots.txt permet de dire à un robot de ne pas crawler une page ou un groupe de pages. Il n’interdit pas l’indexation. »
est ce que çà veut dire que ?
si on rajoute un robots.txt, les pages interdites seront toujours référencés (à priori oui ) ?
si les pages ne sont plus crawlés (autrement dit que la page n’était pas dans l’index) elle ne pourront clairement plus être indexé ?
Ecrit le 14 octobre 2007 à 12h46 par mumuri
Une URL n’entre pas dans l’index quand Googlebot la visite, mais dès qu’il trouve cette URL (lien) quelque part sur le web.
Théoriquement, une URL peut apparaître dans les résultats de Google sans jamais être visitée par Googlebot. Evidemment, c’est pratiquement impossible d’être bien placé sur une requête concurrentielle de cette manière, puisque la position d’une URL sur une requête dépend de la « réputation » (link juice, PR,…) de l’URL et du contenu de celle-ci.
Voir aussi Supprimer une page: pas si simple !
Ecrit le 14 octobre 2007 à 13h15 par Jean-Luc
Merci pour la traduction, j’en prend note
Ecrit le 15 octobre 2007 à 7h11 par Rahir
les meta refresh transmettent bien le PR et ce depuis un moment déjà.
Par contre pour le JS je suis surpris, l’année dernière je m’étais fait blacklisté un de mes sites parce que je faisais une redirection js selon la langue du navigateur…
Ecrit le 16 octobre 2007 à 12h36 par kobe
« Sur les bons moteurs de recherche, il est devenu rare d’avoir une page de résultats complètement spammée. Des progrès importants ont été faits dans la lutte contre le spam des moteurs, mais les astuces utilisées changent chaque jour. Cette lutte n’est jamais finie et Google veut constamment améliorer la qualité de ses résultats. »
Evidemment, mais ceci ne veut rien dire : à chaque changement de l’algo Google, des changements dans les algos des spammeurs… Seul une prise en compte plus importante de l’utilisateur pourrait réduire ça… et encore…
Ecrit le 17 octobre 2007 à 12h15 par Acidifié
Merci pour la traduction, c’est le geste qui compte ! Par contre au niveau de l’entrevue elle-même, eh bien Matt Cutts fait l’auto-promotion habituelle de son employeur et ne nous apprend RIEN … mais n’est-ce pas précisément son rôle ?
Bref tout va pour le mieux dans le meilleur des mondes du SEO.
Ecrit le 23 octobre 2007 à 22h21 par racheumeuneu
bonjour, j’ai trouvé ce billet fort intéressant
je me demandais pouquoi cette précision : « ensemble ils ont fait le point sur les diverses techniques de liens … »
je te souhaite une bone continuation !
Ecrit le 14 décembre 2007 à 23h16 par Potins