Retour sur le test du duplicate

Posted by on avril 8, 2012 in Focus | 19 comments

Comme vous avez pu le lire chez Sylvain, le test sur le duplicate content a soulevé bien plus de questions que de réponses. Revenons sur ce test et ce qui a été fait.

Avant de commencer, j’aimerais revenir sur un point que Sylvain a déjà évoqué dans les commentaires : ce test n’est pas fini et rien que la publication des résultats peut rentrer dans un protocole de test.

Deuxième point (troll), le SEO n’est ni une science ni un art, nous sommes juste deux SEO professionnels essayant de comprendre comment Google réagit face à différents évènements pour mieux les traiter après.

Troisième point : peu importe la durée, le but de la publication est d’ouvrir un débat, pas de prouver que nous sommes des supers héros et que nous avons la Vérité. Si c’était le cas, nous serons déjà en train de siroter des pina colada dans une île entouré de créature de rêve en allant regarder nos comptes d’affiliations exploser tout au long de la journée (bon ça c’est pour moi, Sylvain, lui, serait juste sur une Harley). Bref, vous avez un doute ? refaites le test et voyez par vous même et faites avancer la communauté.

Sylvain vous a exposé son point de vue, je vous expose le mien.

Lors de la publication de son test, Sylvain a fait un appel massif aux RT, +1, Like, etc. Bref, impossible de savoir quel ou quel réseau a envoyé un signal.

Voici, selon moi, une hiérarchie des signaux que Google peut exploiter pour le classement d’un site :

ping < tweet/like < +1 < digg < lien nofollow < lien dofollow < 301

(Evidemment je rentre pas dans les détails des liens et 301 qui n’ont surement pas tous la même valeur, et je ne parle pas de la canonical qui a un comportement particulier)

Durant ce test, les tweets et +1 de Sylvain ont été fait par des SEO. Cet élément a son importance car certains ont un widget pour faire remonter soit leurs tweet, soit tout tweet comportant le terme SEO dans leur blog. Ajoutez à cela que certains SEO manient parfaitement les outils comme scoop.it, posterous ou flavors.me et vous vous retrouvez avec un afflux de lien dofollow issu des tweets. Une recherche sur « L’amour est dans le blog » beaume vous permettra de comprendre.

Le public du test a influencé le résultat

Cette manne de lien n’a pas duré et, même si certains pensent que le test était trop court, nous avons attendu pas mal de temps pour voir comment les choses évoluaient. C’est facile, rien ne bougeait. Et je vous prend le pari que rien n’aurait bougé jusqu’à ce que l’un de nous rende la chose public. Pourquoi ? Tout simplement car je suis persuadé qu’un résultat, s’il n’est jamais recherché, n’a pas vocation a bouger.

En effet, si je vous dit de rechercher « saucisson d’amour au caramel fondant », je vais changer le continuum espace temps le nombre de recherches sur Google sur cet expression et influencer sur le nombre d’impression, le nombre de clics et donc le CTR. Et peut être même me placer en première position.

Mon Analytics m’a signalé que peu de gens ont recherché cet expression aujourd’hui mais sur un taux d’impression très faible, quelques clics peuvent faire la différence sur le taux de clic. Merci donc de rechercher « L’amour est dans  le blog » et d’ajouter « beaume » ou de cliquer sur le beaume-referencement suite à cet article, je suis persuadé que cela aura un impact si vous êtes plus nombreux.

La nature discrète de la demande a influencé le résultat

Continuons un peu sur le terme fort de ce test : le negative SEO devient plus facile. Oui et non à vrai dire. Ce test a montré pendant quelques semaines qu’il était possible d’acquérir une première position sur un article qui n’est pas le sien. Il faudrait reproduire ce test avec un plus gros article. Reste juste à trouver la cible qui ait un article bien trusté et qui accepte de se voir outrageusement plagier…si vous êtes volontaire…

Toutefois, une chose est très claire : acheter des tweets ne sert à rien. Durant toute la durée du test, j’ai vu les tweets défiler de personnes inconnues. La seule page qui a pris du crédit avec ce test est la page du service retweet.it qui reste aujourd’hui bien placé sur la requête. Par ailleurs, ne vous fiez pas aux chiffres données en mode public, ils sont donnés par les syndicats et la police est loin de me donner autant d’optimisme.

Point positif : faire gonfler son e-penis à voir des RT tomber tout seul, ça joue aussi peut être sur son score Klout (pas vu de différence mais j’y vais trop peu souvent pour être sur). Par contre, il y a peu être quelque chose à faire en combinant hashtags précis et repris dans des widgets, multiplications de liens en 301 et faux comptes à gogo. Si vous voulez jouer…allez-y

Les services de RT automatiques sont pourris. Si vous voulez investir, rachetez des comptes et maîtrisez-les.

Dernier point : le plagiat ne date pas d’hier et Google ne peut se laisser berner aussi facilement par quelques tweets et quelques +1. Je vais vous confier quelque chose : je sais que je suis plagié et pourtant je ne fais absolument rien. En effet, mon flux RSS est disponible et vous permet de lire les articles dans leur intégralité. Je n’y gagne rien, et certains me piquent les articles sans scrupule (et comme je suis sympa je leur fait un lien en dofollow).

Peu importe car je sais que, grâce aux signaux sociaux et à la partie « vivante » de la page (les commentaires), je serais toujours reconnu comme l’original.

Bref, quelques pistes de réflexion qui montrent que ce test est à reproduire de nombreuses fois avant de tirer la moindre conclusion. A suivre donc :)

19 Comments

  1. Je fais la même réflexion ici que chez Sylvain, votre test est bien gentil mais il ne prend pas en compte le poids/trustrank des NDDS, ce qui fait une grosse lacune.
    Vos pages ne sont pas référencées ex-nihilo …
    Ensuite il faudrait savoir comment google décide de la qualité et du poids d’un twittos dans le fait de retwitter tel ou tel contenu, avec la notion d’author rank dont j’avais parlé dans cet article : http://www.hounkpe-media.fr/e-reputation-et-seo-2

    Bref, je trouve tous ces tests sur les RS légers!!! :P

  2. Je ne vois pas pourquoi tu te justifies Vincent, quoi qu’il arrive, certaines personnes resteront persuadées que les référenceurs sont des escrocs.
    Concernant le dernier test, pourquoi ne pas cibler une page wikipédia ? On sélectionne une page avec un PageRank faible, peu de Like/+1/RT et on s’amuse. Si cela fonctionne, on passe à quelque chose de plus gros.

  3. Le test est intéressant mais il faudra voir ce que cela donnera dans quelques mois. Une contre-analyse plus tard serait intéressante.

    En tout cas les réseaux sociaux prennent de plus en plus d’importances, ça c’est sûr.

    Concernant les services de RT automatiques, je pense aussi que ça ne sert pas à grand chose, c’est trop facilement identifiable.

  4. Bonjour Vincent,

    Tu l’as bien évoqué dans ton billet à savoir que ce type de test est à reproduire plusieurs fois avant de tirer des conclusions fiables d’autant que beaucoup de paramètres, avec des degrés d’influence variables, peuvent intervenir sur le résultat final.

    Par contre, merci d’avoir réalisé ce test car il soulève des réflexions auxquelles je n’avais pas pensé. A suivre…

    amicalement

  5. @Samuel : Je ne comprends pas ton scepticisme. Au contraire, nous avons bien fait gaffe au poid des NDD, toutefois la seule méthode pour cela est : l’age et le nombre de liens. Nous nous sommes basé sur le chiffe OSE qui nous semble légitime et nous avons vu que Jambonbuzz avait un plus gros poids que le beaume. Pour ce qui est du poids d’un twittos, j’ai fait un test sur un RT d’un gars qui avait 50 000 followers, rien n’a changé. Je pense qu’il n’existe pas (encore) de notion de « poids » de twittos, par contre, il existe des curateurs plus férus que d’autre.

    @Gwara : pas de justification outre mesure, je cherche juste à aller plus loin et j’appelle à tous les sceptiques de faire avancer le débat au lieu de se contenter d’un « Cénul ». Bonne idée pour le wikipedia.

    @Edouard : je pense qu’avec la publication de ces deux articles, le test devient caduque. Mais bon comme dit précédemment, ça permet de voir comment Google réagit.

  6. Tout comme Aurélien – a la fois ici et sur le blog de sylvain –
    Deja il faudrait refaire le test histoire d’avoir une situation témoin – cela validerait beaucoup d’éléments de votre test, ensuite il faudrait voir si un site plus vieux / important / trusté peut voir son classement changer si un site moins bon buzze plus – pour cela on pourrait effectivement aller déboulonner une page Wikipédia par exemple

  7. Pour ma part je trouve ce test très intéressant.
    Ceux qui ne savent pas trouver l’intérêt de celui ci devraient changer de voie.
    L’idée est bien de s’interroger sur le comportement et le résultat des algo.
    Cela confirme en grande partie (et j’attends la suite) la puissance des commentaires et leur participation à l’autorité d’un site.

    Good job les gars ;) et merci pour le partage

  8. Ce test est interessant mais dans tous les cas il est impossible d’avoir de certitude (comme presque tout ce qui concerne le SEO, hormis la balise keyword xD). Il y a trop de facteurs externes qui entrent en compte.
    Mais on peut se faire de bonnes idees qui ameneront surement d’autres tests.

    Dans tous les cas si vous cherchez un site recent pour faire des tests, je suis ouvert. Mon site a que quelques moi, peu de BL et un page rank affiché a 0. (On se moque pas dur dur de travailler son netlinking dans un van avec une cle wifi a l’autre bout du monde xD).

    Merci pour ce test.

  9. L’idée du test est vraiment intéressante, mais le fait de ne laisser passer que 3 jours entre les 2 publications me parait être un délai relativement court.
    Peut-être que je dis n’importe quoi, mais pour corroborer le test, j’aurais refait la même chose en inversant les sites (publier 1′article sur le blog de Sylvain, puis publier le duplicate sur le tien en procédant de la même manière), juste pour bien s’assurer que les résultats soient identiques et « confirmer » l’hypothèse :)

  10. Bien vu ! Rendre public et demander le partage (plus ou moins réussi, comme apparemment ton article a quand même été retweeté) fausse quelque part un peu le test, notamment pour les recherches orientés et taux de clics des internautes (il faudrait voir aussi le taux de rebond non ?).

    Une idée serait de créer un panel de testeurs en lesquels vous avez confiance, et pour lesquels vous donneriez des instructions précises à faire et ne pas faire (pour les clics, rebond, fréquence de visite, RT, +1, …).

  11. Matt Cutts a consacré une vidéo à ce type de cas précis, à ceci près qu’il s’agissait de liens, plutôt que de réseaux sociaux. D’ailleurs, la plupart des réseaux sociaux se faisant scrapper, il est fort probable que des liens soient présents un peu partout sur le Net. Et puis, il est pertinent de croire que les réseaux sociaux engendrent aussi des signaux sur le classement des résultats des moteurs de recherche, et que Google s’y fie de manière similaire à celle des liens.

  12. Je ne comprends pas bien le test ou alors qq chose a changé?
    qd je tape « l’amour est dans le blog », j’obtiens la page de jambonbuzz en 1er:
    L’amour est dans le blog
    http://www.jambonbuzz.com/…/lamour-est-dans-le-blog-2012-03-1... – France
    14 mars 2012 – Avoir un blog, c’est avoir la possibilité de rencontrer beaucoup de gens, de la gente féminine en particulier. Bien que je ne sois plus un coeur à …

    qd je tape « lamour est dans le blog beaume », j’obtiens la page de beaume-referencement :
    L’amour est dans le blog | baume référencement | SEO
    http://www.baume-referencement.com/lamour-est-dans-le-blog/
    17 mars 2012 – Avoir un blog, c’est avoir la possibilité de rencontrer beaucoup de gens, de la gente féminine en particulier. Bien que je ne sois plus un coeur à …

  13. @ Tony
    On m’a déjà fait la remarque du « faible » laps de temps entre la publication de l’original et de la copie.
    En fait, c’est peut-être le contraire. Dans la vraie vie, les articles sont souvent dupliqués quelques heures après leur sortie. Les filous sont par exemple alertés en étant inscrits aux newsletters, certains scrappent même directement à partir du flux RSS.

  14. Honnêtement, le scraping n’est pas un problème dans la majorité des cas : un site est scrapé lorsqu’il est connu et il possède en général la notoriété suffisante pour ne jamais être doublé par un scraper. CF la notion de scrape rate introduite par Jon Cooper : http://pointblankseo.com/scrape-rate

    Le test donne un résultat assez étonnant, mais il reste à faire pour se protéger de cette exploit (rel author, scrape report à Google…)

  15. En fait si c’est confirmé c’est une technique redoutable de nSEO.
    Car si aux réseaux sociaux on ajoute du netlinking classique ça doit être encore plus violent !

  16. Le test est important mais je penses comme il a dit Edouard que les réseaux sociaux prennent de plus en plus d’importances. Donc il faudra viser les réseaux sociaux :)

  17. Ce test est très intéressant et montre le poid qu’Est entrain de prendre le social seo sur le positionnement web. Comme quoi même un article dupliqué peut passer devant l’original grâce à des tweets et +1.

  18. Test très intéressant, je suis persuadé vu certains de mes testes que les notions importantes pour le référencement sont : Beaucoup de backlink avec de bonnes ancres, beaucoup de partage sur facebook, tweeter etc.. votre article confirme un peu mes tests !

  19. Bonjour,

    Les résultats semblent être revenus à la normale, donc l’effet « buz » peut vite s’essouffler. Par contre je me demande comment Google peut utiliser des outils comme Facebook, ou twitter sans pouvoir vérifier si le compte est bien géré par une personne (et non pas crée par des agences web sans scrupule)?

    Merci d’avance,

    Ludovic