« 4 Secrets pour Pousser vos Visiteurs à Cliquer sur vos Posts et vos Pubs | Home | Utilisation des Liens thématiques Adsense »

juil 15 2008

Le Duplicate Content: Ce n’est pas du tout ce que vous croyez !

Posté Par SeoMan a 23:36 Dans Autres, Google, SEO Intermediaire

Première visite ici? Suivez les articles du blog via RSS. Merci pour votre visite!

copie duplicate content

Beaucoup de Bloggeurs se trompent légèrement sur le sens et la réalité du “Duplicate Content”.
Je vais essayer d’éliminer les rumeurs et d’étayer cela par des exemples, pour balayer cette peur des pénalités qui n’a plus lieu d’exister.

Premièrement voyons ensemble ce que la majorité des bloggeurs pensent du Duplicate Content, et ensuite on verra la réalité de la chose.

Pour commencer la croyance populaire de la blogosphére tiennent pour vrai le fait que les posts syndiqués ou la multi diffusion des posts les mènera à coup sûr vers le retrait pur et simple des index de Google ou de Yahoo.Si cela était vrai prés de 99% des articles publiés sur le web, les infos reprises des agences de presse et tout les flux RSS le seraient aussi.

LCI,TF1,L’AFP,France2,Google News, violeraint allégrement ces règles du Duplicate Content ?

Ils utilisent généralement les même informations issus des mêmes sources du même auteur, si ils transgressaient ces règles, les algorithmes des moteurs de recherchent captureraient 5000 occurences de la même information ? Je suis sûr qu’il aurait été détecté, et si il avait enfraint les régles ils auraient été pénalisés aussi tôt et donc retirés des index des Google et autre Yahoo.

Les sites à contenu libre, utilisent des posts dupliqués pour les publiers sur leur répertoire et issu du même auteur.et vous pouvez trouver des centaines des même articles indéxès dans les moteurs de recherche en même temps !

Un petit test allez sur le site Articles Gratuits et prenons un article intitulé “Défiscalisez avec la nouvelle loi Borloo” ensuite prenons ce titre avec les guillemets et procédons à une recherche sur Google et Yahoo , On a 82 résultats identiques sur Google et 52 sur Yahoo.

duplicate content SERP

Cet article a été publié pour la première fois en Novembre 2005, le Dimanche 27 plus exactement.Il est vrai que si les moteurs de recherche filtrent le “Duplicate Content” de ce type, cela leur a laissé prés de 32 mois pour filtrer ce contenu, Mais ce n’est pas le cas !

Certaines même arrivés aprés la publication de l’article original ont du contenu Adsense bien visible et ne sont donc pas considèrés comme enfraignant les TOS Adsense.

adsense duplicate content

Ceci est un simple test sur un seul article , essayez par vous même . Il y a des millions d’articles publiès sur des sites différents et les sites sont toujours la, ils n’ont pas été pénalisés .

Nous allons voir maintenant ce qu’est réellement le Duplicate Content ? et quelles règles le régissent ?

Le Duplicate Content est quand vous faite l’exacte copie d’un site, Page par page,Fichier par fichier, image par image, code pour code.Et que vous obtenez l’exacte réplique du site ou de la page.Utilisé par les aspirateurs de sites, ou pour ceux qui utilisent une multiplicité de site unique pour générér des revenus adsense (MFA principalement), ou encore les sites à portes dérobées utilisées dans le cadre du SEO Black Hat (je vois que le sondage à gauche du blogne penche pas en faveur du BlackHat) ou encore les spammeurs qui dévient l’utilisation des fermes de sites identiques pour controler les SERP .

Vous voulez essayer ? prenez l’exacte copie d’un site et hissez le le plus haut des SERP avec des liens entrants.Il est certain que l’un des deux sites sera supprimé de l’index, pas une page, pas deux mais la totalité du site.Testé et vérifié plusieurs fois.

Chaque post, chaque communiqué de presse, et même les pages avec contenu généré à partir de flux RSS ont des codes sources différents, des fichiers différents, des Javascripts différents ce qui les protège de la pénalité du Duplicate Content.

Ne vous souciez pas des pénalités du au duplicate content si vous n’êtes pas dans les catégories citées plus haut.
J’espére que ce petit article vous aura éclairé sur le Duplicate Content et sa réalité, et que cela nous permettra de tester pour vérifier les multiples croyances et autres légendes urbaines du SEO.

Si ce post vous a intéressé n’hésitez pas à vous abonnez aux flux RSS flux rss seo adsense referencement ou les recevoir directement par Mail 

@+

Related Posts Plugin for WordPress, Blogger...


24 Commentaires to “Le Duplicate Content: Ce n’est pas du tout ce que vous croyez !”

  1. Ridiculeon 16 juil 2008 at 0:23

    C’est bien de vouloir aider, mais c’est un peu ridicule comme “aide”; Aussi, lorsqu’on soumet sur reddit, c’est toujours mieux si on soumet dans la bonne catégorie? Il s’agit de contenu principalement anglophone, le français étant relègué à la section “FR”

  2. SeoManon 16 juil 2008 at 0:43
    @Ridicule
    le but n’est pas d’aider mais de partager ;)
    pour reddit, la preuve que ca marche même via la partie anglophone c’est toi ;)

    merci pour le conseil ;)

    tu as l’url de reddit french ?

    @+

  3. annakon 16 juil 2008 at 15:10

    C’est rassurant en tous cas :)

    PS : Comment tu as osé poster dans une mauvaise catégorie ? ;)
    Dernier Post de annak.Ecrire en chinois

  4. SeoManon 16 juil 2008 at 19:03
    @annak ;)

    tu l’aurais mis dans laquelle ? ;)
    @+

  5. Guillaumeon 17 juil 2008 at 2:40

    Intéressant mais j’émets des doutes.

    Sur l’un de mes sites, j’ai remarqué une chute flagrante dans mes positions et une indexation énormément plus lente de mon contenu. J’ai alors pensé au duplicate content à cause des multiples agrégateurs RSS (pas toujours de qualité…) qui utilisaient le contenu de mon site. J’ai alors demandé à un certains nombres d’entre eux de m’enlever de leur contenu et j’ai vu 2 jours après un retour progressif de mes positions ainsi qu’une indexation revenue à la normale.

    Est il donc impossible d’avoir du duplicate content dans de telles circonstances ? Bien qu’il soit vrai qu’il est possible que mon problème soit dû à d’autres facteurs, le duplicate content dans ce cas précis me paraît être la cause.

    Dernier Post de Guillaume.Matthias a découvert le secret de Cyril

  6. annakon 17 juil 2008 at 6:22

    Ne me demande pas de conseils là-dessus, les catégories sur la plupart des réseaux sociaux restent un grand mystère pour moi :D
    Dernier Post de annak.Un menu horizontal en CSS et HTML

  7. SeoManon 18 juil 2008 at 19:27
    @Guillaume quel était le type d’intégration rss ? affichage du texte ou via un widget ?ce qui m’étonne c’est que ce soit si rapide en pénalité et en retrait de pénalité ? tes classements SERP sur lequel tu as été pénalisé étaient sur exactement les même mots clés ?
    A suivre …

    @annak mince alors…je vais encore me faire sermonner par Ridicule

    @+

  8. Guillaumeon 19 juil 2008 at 6:07

    Exactement les mêmes mots clefs. Mes flux RSS étaient entier, désormais ils sont tronqués et je ne rencontre plus ce type de problèmes.

    Dernier Post de Guillaume.Nathalie quitte Secret Story

  9. SeoManon 19 juil 2008 at 10:07
    @guillaume ok , ce qui est étonnant c’est que les pénalités soient retirées en deux jours …même progressivement …
    a creuser (je pense notamment au cross linking mais il faut voir) avec les données du site et l’exemple que tu as donné (url,flux rss,etc..)
    @+
  10. SeoManon 20 juil 2008 at 18:16
    @guillaume
    apparement il y aurait une nouvelle pénalité Google qui a fait son apparition il s’agit du Feedbox (relatif à Sandbox)
    c’est relativement récent Fin juin 2008
    voir un bon post sur le sujet

    http://algorithme.je.t-ai.eu/google/penalites-google-penalite-keybox-feedbox

  11. redpepperson 21 juil 2008 at 16:57

    Hey merci pour cet article très intéressant, car c’est qu’on entend tout et n’importe quoi au sujet du duplicate content…
    Merci également pour l’info du commentaire précédent le mien, je vais m’empresser de suivre ce lien…

    @+
    ;)

  12. seccuson 01 août 2008 at 14:37

    Je sais que nous vivons dans un monde où les points de vue peuvent différer grandement. Que rien n,est jamais certain. Sauf qu’à un certain moment, il y a des choses qui deviennent claires par loi de la nature ou par consensus humain. Avec Google et les approches SEO, il y a des domaines où les contradictions me font suer. Et le duplicate content en est un. Par exemple, j’aime la recherche et l’analyse que tu a faite Seoman. Par des faits, tu nous démontres que la définition de ce concept ne tient pas la route. Sauf lorsque je suis l’avis de Google : http://wordpress-tuto.fr/duplicate-content-google-definition-302, et celle dans le journal du Blog : http://www.lejournaldublog.com/duplicate-content/, les doutes me reviennent.

  13. SeoManon 09 août 2008 at 1:30
    @redpeppers you’re welcome ;)
    @seccus exact les exemples et les contre exemples ne permettent pas d’y voir clair…ceci dit le journal du blog cite ce post comme vision intéressante…je te ferais une réponse de normand, la vérité doit se situer entre les deux ..;)
  14. MONTORDon 15 sept 2008 at 14:13

    resamaurice.com et resamauritius.com

    visiter ces 2 adresses, duplicate ou non ?

    a plus

    Arnaud

  15. grafik75on 28 sept 2008 at 17:46

    Hum, y’a pas des droits d’auteur pour la photo de l’artiste peintre ? Elle a donné son accord pour l’utilisation ?
    http://www.atelier-bonno.fr

  16. SeoManon 28 sept 2008 at 18:14
    @grafik75

    malheureusement pas de contacts souhaites tu que je la retires ?

    ou me donnes tu ton accord pour l’utilisation ?

  17. grafik75on 28 sept 2008 at 18:29

    Pas de contact ? il suffit de chercher un tout petit peu, surtout en faisant un hotlink vers l’image tu as l’adresse de l’original…
    Je ne suis pas Anne-Sophie donc je ne peux pas donner son accord ! Elle a un site avec une adresse mail dessus, non ?

  18. SeoManon 29 sept 2008 at 20:02
    @grafic75 photo retirée
    @+
  19. Davidon 27 oct 2008 at 13:51

    Hello Seoman,

    Voici quelque chose de concret qui m’est arrivé avec preuve à l’appui :
    http://blogityourself.net/google-ma-puni-il-exclut-requetes/

    Mes billets étaient remplacés par ceux de blogasty, paperblog, etc …

  20. SeoManon 27 oct 2008 at 15:11
    @david je ne suis pas sur que ca soit une pénalité DC qui ait eu cet effet tu seras complétement désindexé sinon or t’es juste dérriere seulement Google pense que les pages paperblog sont plus pertinentes que toi sur ce point :(:(

    moi je me désinscrirais de paperblog qui profite plus qu’il ne te fait profiter donc paperblog –>out

    pour le reste ces aggrégateurs sont considérés comme plus pertinents que toi sur ces sujets à juste titre vu le nombre de personnes qui sont repris dessus surtout que tu a un blog généraliste au sens blog ou tu peux parler de musique etc…et pas seulement ref et SEO

    donc en conclusion : moi je me suis désinscrit de paperblog qui fagocite ton classement serp
    en reprenant tes posts complets avec une redirection à la noix de coco
    sinon blogasty fait juste un lien donc si il est mieux classé que toi ca permet de faire ce que j’appelle du SEO par procuration , rappelles toi de mon post sur knol —> si blogasty est bien référencé pour tes posts les visiteurs finiront par arriver sur ton blog si ‘laccroche est intéressante ….d’autant plus que de mémoire il ne reprennent qu’un bout du post (excerpt)

    @+

  21. David LOUISon 28 oct 2008 at 7:40

    Ok Seoman, pour toi, quand on est victime de Duplicate content, les articles sont carrément desindexés de Google. Déjà, il faut que je te dise que je n’ai plus de problème depuis 2 mois environ, tout est revenu dans l’ordre. Car j’avais tout de suite compris d’où venait le problème et d’ailleurs, j’avais fais toute une série de billet (une sorte de journal de bord) concernant mon problème, par exemple :
    http://blogityourself.net/regles-referencement-vraies/

    Après je pense sincèrement qu’il est bien dans sa démarche de SEO, d’éviter trop de contenu dupliqué sur son blog (cf. http://blogityourself.net/creer-fichier-robotstxt-referencement/).

    Bref, personnellement, lorsque je parle de duplicate content, c’est quand tu gères un blog tout jeune et que tu t’inscris sur des sites qui reprennent l’intégralité de ton flux. Google ne sachant pas qui est l’origine du billet, il va retenir le site qui a un plus fort pagerank et donc ton blog est zappé des requetes google mais pas de l’indexation.

    Si ça vous arrive, voici quelques actions à effectuer en priorités :
    - Se désinscrire de ces sites;
    - Utilisez la balise ‘more’ sur l’index.php pour tronquer l’article;
    - Utilisez le fichier robots.txt pour indiquer à google de ne pas indexer vos articles repris dans vos archives, tags, catergory, search…
    Déjà Google y verra plus claire.

  22. SeoManon 29 oct 2008 at 0:02
    @david merci pour ta réponse : oui c’est ce qu’on appelle une pénalité duplicate content et elle est mélangée très souvent avec un simple classement sur des SERPs lié à de la pertinence supposée.
    je pensais que les exemples que j’avais donné sur le post avec la phrase “Défiscalisez avec la nouvelle loi Borloo” mais apparement ce n’est pas suffisant ;)
    pour étre pragmatique un site qui ne t’apporte pas de trafic il faut le virer surtout si il reprend les posts complets type paperblog ,pour les autres types Wikio , contrairement à la mode actuelle, je pense que Wikio via ce que j’appelle le SEO par procuration peut réellement vous apporter au pire du trafic et au mieux de la vitesse en terme de réferencement…
    je ne sais pas si tu as fait marché le chrono mais la vitesse d’indexation des posts qui passent par wikio peut étre de l’ordre de 15 minutes voire moins…
    il faut toujours penser à utiliser les sites sociaux à son avantage…(je passerais sur l’utilisation par wikio de redirections douteuse, mais j’ai cru comprendre que c’était du passé )
    qu’en penses tu ?
  23. Presseon 27 déc 2009 at 11:52

    Voilà un article qui tord le coup à beaucoup de préjugés sur le DC.

    Question par contre : pourquoi les annuaires de liens veulent des “descriptions uniques” ? Si on suit ton raisonnement il ne devrait pas y avoir de souci à répéter plus ou moins les mêmes titres/descriptions d’un annuaire à l’autre ?

  24. [...] Un blog WordPress bien référencé, le cas du Duplicate Content [...]