Pourquoi Google n’arrivera pas à combattre le spam

Posted by on mars 26, 2012 in référencement | 27 comments

Un billet de fond pour finir Mars. Ce que je dis n’est qu’un sentiment personnel et j’espère que cela vous ouvrira l’esprit sur la sur-dominance du spam dans les résultats Google.

« We try to make the GoogleBot smarter, try to make our relevance more adaptive, so that if people don’t do SEO we handle that »

Cette phrase a été prononcé par Matt Cutts à un gros évènement (le SXSW). Encore une fois, c’est un effet d’annonce respectant le FUD de Google. Pourquoi ? Car Google a une faille énorme qu’il ne peut corriger sans modifier profondément l’intégralité de ses résultats.

Je ne vais pas vous parler des liens, sujet maintes fois évoqué mais plutôt des redirections. La redirection 301 est l’ami du référenceur, et surtout du spammeur.

Je m’explique en vous donnant quelques astuces qui fonctionnent pour le référencement d’un site :

  • Repérez un domaine expiré qui comporte des liens, achetez-le et faites une redirection 301, vous récupérerez une partie du jus des liens (parfois sur des bons sites genre du .edu)
  • Vous avez une pénalité ? Redirection 301. Si on part du constat que ce serait trop facile de blacklister un site avec une simple redirection, par extension, il est simple de sortir d’une pénalité.
  • Vous souhaitez faire des liens pourris et ne pas vous faire goler ? Faites le pointer vers un site qui aura des redirections 301, Google et tous les traceurs n’y verront rien. Vous n’avez pas de site dispo ? Google peut vous en fournir un : goo.gl

Des exemples, vous pouvez en trouver des tas. Là où Google à les pieds et poings liés est qu’il ne peut toucher à cela sans péter un maximum de lien et surtout rendre caduque tous les raccourcisseurs d’url.

Est-ce que Google va prendre conscience de cela ?

Peut être que oui… ou pas…

Et vous, pensez vous que Google réussira un jour à combattre le spam ?

27 Comments

  1. Mmhhh je ne suis pas sûr de comprendre l’argument de la 301 avec laquelle il serait « trop facile de blacklister » un site. Est-ce qu’il ne « suffirait » pas pour Google de faire en sorte qu’une 301 depuis un site pénalisé ne transmette pas de jus ?

  2. Voici des affirmations particulièrement naïves. Selon toi, Google traiterait tous les liens à l’identique, y compris des redirections 301. Or, Google pénalise bien les sites bénéficiant de liens de qualité qu’il juge mauvaise. Il n’y a aucune raison que cela change par l’astuce de la redirection.

    Il y a un excellent article sur SEOMoz sur la difficulté de comptabiliser les liens. Comment compte-t-on les liens disposant de trois liens dont deux pointent vers deux redirections 301 différentes pointant vers la même page, et le troisième lien un lien direct indépendant ? Bref, ce sont des choix que Google résout au quotidien. Il n’y a pas de bonne ou de mauvaise solution, juste un choix, un parti pris, pour chaque cas particulier.

    Quant aux spammeurs, la quasi-totalité n’a aucune visibilité.

  3. Il n’y arrivent pas de toute manière.
    Bien sur de temps en temps ils font sauter un réseaux trop peu discret de liens : http://actu.abondance.com/2012/03/google-penalise-un-reseau-de-liens-le.html
    Mais dans le fond, ils savent très bien que leur algo est en fin de vie.
    Ils se content juste d’appliquer un patch de temps en temps pour calmer le jeu et montrer leur détermination.
    Dans le fond rien de méchant pour la majorité des SEO’s, si Google souhaitait vraiment tuer le spam il aurait juste à réduire à néant la valeur des backlinks en provenance des blogs WordPress, et il pourrait ainsi diminuer le spam de 70% en un shoot !
    Mais le spam fait vendre des Adwords, alors pourquoi se tirer une balle dans le pied ?
    Loïc

  4. Oui, c’est aussi ce que j’explique à Olivier sur Abondance concernant l’effet d’annonce !

  5. @exo21 : merci pour ton commentaire. En effet, je n’ai pas assez détaillé ce point de vue qui est excellent

    @martin : merci à toi aussi. Je pense que Google traite tous les liens à l’identique lors du crawl, ce serait trop dur et couteux pour lui de faire ça à la volée. Puis viennent plusieurs algorithmes qui vont traiter tout cela et ça se complique. Que veut dire « Google pénalise un lien » ? Peut-on appliquer une sanction à un simple lien ? Si je fais un lien vers toi avec une mauvaise ancre, est-ce que je mérite une pénalité ? Comme tu dis il faudrait un parti pris pour chaque cas particulier mais traiter le web (et le spam) demanderait plus de temps/homme que la terre en dispose.

    Google doit donc appliquer des « exemples » qui sont assez sévères pour ne pas promouvoir le spam mais assez laxiste pour éviter des problèmes pour les utilisateurs lambda. La redirection permanente est un véritable talon d’achille pour Google AMHA.

    Il est possible de « couper le jus » des liens mais dans le cas de l’achat d’un site où tous les liens sont légitimes, le robinet ne se fermera pas si rapidement.

    Et un spam n’a pas vocation à se placer, il a vocation à propulser le site qu’il va lier directement.

    Je suis étonné que personne ne s’étonne du dernier lien…

  6. Je ne vois pas bien pour le moment où tu veux en venir sur le lien en question. Il est tard, ça doit être ça.

    Le fait que des 301 soient indexées ? Le fait que la home est absente des premiers résultats ?

    Un indice à donner ?

  7. Bienvenue surtout au paradis des référenceurs… Le traitement par Google est un véritable cadeau, mais il est logique.

    Imaginer Google neutre vis à vis d’une 301, serait illogique :

    – le moteur ne peut se permettre de vérifier si chaque 301 est véritablement un changement de ndd du site

    Ainsi, dans le même temps, et pour la même raison, tu es dans le vrai : il ne peut pas pénaliser un site à cause d’une 301. La NSEO deviendrait low cost et monnaie courante..

    Donc oui, aujourd’hui, avec des 301, on fait ce qu’on veut, et malheureusement pour Google, il est impossible (d’un point de vue moyens), de les traiter autrement.

  8. Tiens, je pensais que faire une 301 d’un site pénalisé vers un site clean placé sur les mêmes requêtes jouait en sa défaveur.

    Le liens de Vincent permet de voir que Google indexe les 301. Ce qui, je présume, est une piste de réflexion.

  9. Google ne vaincra le spam que le jour où il comprendra le sens d’un texte et ce n’est pas pour demain 🙂

  10. Comme Keeg, je cherche pour ton lien et j’aimerais bien un indice.

  11. Bonjour Vincent,

    Google peut largement améliorer la pertinence de ses résultats en luttant contre la spam. C’est une lutte sans fin puisqu’il y aura toujours des techniques de spam qui auront forcément un temps d’avance. Donc, cela me semble utopique de vouloir éradiquer toutes sortes de tricheries.

    Je pense que Google a intégré depuis bien longtemps ce fait ! Améliorer oui, éradiquer c’est impossible !

    amicalement

  12. En effet, comme Jérôme l’a souligné, Google indexerait certaines 301. Vous pouvez faire le test avec tous les raccourcisseurs pour avoir le même résultat. J’ai un peu de retard sur cette news je vous avoue car il y a quelques semaines les résultats étaient bien plus grands.
    Certains l’auront compris, le titre de cet article est un troll, le but est de voir les choses changer mais chaque action qui peut entraîner du NSEO et qui est donc non pris en compte comme elle devrait l’être du coté par Google est une faille de plus pour les spammeurs.
    Matt, si tu me lis :p

  13. Je ne suis pas forcément d’accord avec toi Vincent, il y a bien plusieurs traitements, mais il est vrai que nous abusons avec les 301.
    Quant au commentaire de Martin : « Quant aux spammeurs, la quasi-totalité n’a aucune visibilité. », on ne doit pas naviguer sur le même moteur.

  14. C’est comme pour le no-follow… un jour il dira : « vous avez abusez, Moi le grand Dieu Google décide que les 301 n’ont plus de poids et perdent 99% du jus qu’ils donnaient »… et on aura plus que ses yeux pour pleurer !
    Et la vérification d’un changement de nom de domaine peut être faite en rétro action puisque Google est nu registrar…

  15. Hello,

    Voici un réflexion sur les commentaires plutôt que sur l’article.

    Google est capable d’identifier et de regrouper les sites par « type ». Ainsi on peut notamment imaginer une pondération des liens par type + des primes à la diversité.

    J’en veux pour preuve notamment les options liés aux labels dans Custom Search. On imagine, les possibilités non « publiques » dont dispose Google. Surtout que cela date d’au moins de 2007 (cf commentaire de Thomas)

    http://www.outil-referencement.com/blog/index.php/390-indices-google

  16. Le combat de Google contre le spam est un combat perdu d’avance, rien ne sert de lutter !
    Je suis d’accord avec un précédent commentaire ; Google n’a pas encore la capacité de comprendre totalement le sens de textes alors même s’il livre de petites batailles contre le spam, il ne sera jamais en mesure de l’éradiquer totalement…
    Le jour où cela arrivera, nous sommes finis =)

  17. Il y avait un article récemment sur SEOMOZ je crois d’un mec qui a trusté la première page avec pratiquement une landing page pendant 2 mois sur « car insurance », l’auteur de l’article évaluait sa position à 4 millions de $ par mois . Si cela est possible dans un tel secteur où le spam report doit aller plus vite que Lucky Luke sous amphet un jour de pleine lune, je me dis que google reste google.
    Je pense qu’il faudrait engager des precogs chez les googlers comme dans minority report, une voie à créuser?

  18. Honnêtement, cette faille Google ne devrait pas durer longtemps je pense, je ne vois pas ce qui bloque Google pour filtrer les 301 spammy.

  19. J’avais envie de ruer dans les brancards en lisant le commentaire (naif) de @Martin, mais bon je suis de bonne humeur aujourd’hui ^^
    Y a un truc qui me tracasse à propos des redirections.
    C’est clairement un point faible. J’en parle en connaissance de cause puisque la démonstration que nous avons faite pour le vol du PageRank était basé là dessus. Cela pouvait également déstabiliser un site (negative SEO). A l’époque, j’avais aussi observé des pénalités qui suivaient la 301.

    Aujourd’hui, je n’ai plus trop le temps de tester, mais je reste persuadé qu’il reste des bidouilles à faire là dessus.

  20. Tiens c’est marrant ça, google indexe les pages 301… Mais en même temps il n’y en a que 2000 et des poussières dans l’exemple donné. Il devrait y en avoir des millions si il les indexait systématiquement. Qu’est-ce qui l’arrête alors dans son élan ?
    La première est redirigée vers une 404, je pensais tenir un sujet, mais non : les autres pas.

  21. L’imagination des spammeurs est sans limite, la lutte est sans fin

  22. Tu soulèves ici une réflexion intéressante. La 301 est une reco de Google. A partir de là, difficile pour lui de sanctionner un webmaster s’il en a tiré avantage de manière outrancière.
    Pour ce qui est de t.co, Google n’a peut-être pas apprécié ce qui a l’air d’être un cloaking ? cf http://b1n.sp1n.me/seo/twitter-pratique-cloacking.128.html

  23. Quoi qu’il arrive ou que Google fasse, il y aura toujours un moyen de s’y adapter. C’est aussi ça qui fait que notre métier est ce qu’il est.

    Il y a pas mal d’années, on misait sur la balise keywords. Allez dire ça à un SEO de 20 ans aujourd’hui 😀

  24. Je suis plutot d’accord sur le fond – a savoir que GG va avoir du fil a retordre quand il s’agira de traiter le spam par 301 – dont on a pu voir d’ailleurs les effets lors des recents concours de referencement – maintenant je modererai le propos toutefois – e Ca va pas etre simple a priori mais ca n’a a mon avis rien d’impossible

  25. par extension, est ce que ce ne serai pas un moyen de pénaliser un site concurrent? Une sorte de blacklistage?

  26. Je reste dubitatif quand à l’achat d’un site avec des liens… Certains ont testé ça ? C’est pas le bac à sable direct ça ?

  27. Un peu astucieux pour les redirections 301, mais je reste perplexe quand à la deuxième point car je ne pense pas que Google ne soit pas en mesure de contrer le jus transmis depuis un site pénalisé.