« 5 Conseils pour Contrer la copie du contenu de votre Blog | Home | LeWeb 08 Retour sur images »

déc 07 2008

Google et le Duplicate Content

Posté Par SeoMan a 18:06 Dans Google, SEO, seo debutant

Première visite ici? Suivez les articles du blog via RSS. Merci pour votre visite!

 duplicate content

Crédits photo : Céline

Le Duplicate Content ou le contenu dupliqué fait couler beaucoup d’encre et il continuera à le faire vu sa complexité, j’avais déjà donné ma vision sur le duplicate content il y a quelques temps, on va aujourd’hui revenir sur certaines notions du Duplicate Content vu par Google.

Deux points importants peuvent mener au duplicate content en SEO : Le filtre dit duplicate content et la pénalité Duplicate Content :

Le filtre Duplicate Content (Google) 

C’est en fait un filtre dans les classements SERPs Google et dans les algorithmes d’indexation pour dénicher les reprises d’informations et les filtrer hors des SERPs.Le filtre signifie que deux documents (terme générique) ont un contenu similaire et sont accessibles via deux adresse URI différentes, Google détermine lequel des deux documents est le plus important, lequel est l’original et lequel est la copie.Ensuite le contenu dupliqué est retiré et seul le document original est préservé dans les SERPs (on parle bien de copié collé, y compris les Sidesbars, etc…) .

Le filtrage n’est pas très dangereux pour les blogs, le but étant de garder les SERPs propres et d’éviter d’avoir des SERPs avec des sites repris et des doublons multiples.Google ne garderait que le contenu original , cela est relatif puisque Google est très laxiste sur le terme duplicate content, à juste titre vu que les liens via vos catégories, tags n’est pas considéré comme du contenu dupliqué contrairement à ce que l’on peut lire ici et la.

En conclusion le filtre duplicate content est simplement le fait de retirer par exemple une des deux versions online et printer friendly si la deuxième n’est  pas bloqué par un noindex meta tag, un robots.txt ou un Nofollow .

La pénalité Duplicate Content 

A coté de ça, Google utilise aussi une pénalité dite duplicate contente avec une procédure à la clé.Celle ci résultera à des ajustements appropriés laissé à la diligence de Google et qui peuvent varier - selon la nature du duplicate content - d’un simple déclassement simple du plagieur au retrait pur et simple des SERPS et de l’index Google du site copieur.

Donc, quand Google trouve  deux blogs identiques avec le même contenu et que cet état de fait n’est pas accidentel (Spam, MFA,Reprise de Flux RSS, Spam Agrégateurs,etc…) ils déterminent à ce moment la lequel est la source originale, ils ajustent alors les serps pour certains mots clés.La pénalité ne concernera que certains pages et pas les sites en entier.

Si vous vous retrouvez soudainement relégués pour certains mots clés ou sur certaines pages de votre blog, il est probable que vous soyez victime de la pénalité Google Duplicate Content.

La plus dangereuse manifestation de la pénalité duplicate content est quand votre homepage ou vos pages les plus importantes sont touchées.Si c’est le cas de votre page d’accueil, traditionnellement la plus visitée, cela impactera fortement votre trafic.

Ces différentes notions sont très rarement usitées par Google il n’y a qu’a voir  les classements SERPs, le pire qui puisse vous touchez si vous êtes clean c’est de vous voir dépasser par un copieur auquel cas n’hésitez pas à vous défendre.

Pour suivre la liste de posts n’hésitez pas à vous abonner aux flux RSS flux rss seo adsense referencement ou les recevoir directement par Mail 

ou vous pouvez me suivre sur Twitter follow twitter

Related Posts Plugin for WordPress, Blogger...


13 Commentaires to “Google et le Duplicate Content”

  1. Fabien Pretreon 07 déc 2008 at 18:27

    Intéressant. Merci pour ces infos. Au plaisir de te lire

  2. SeoManon 07 déc 2008 at 19:52
    @fabien merci ,le ducplicate content est un sujet épineux et les avis sont très partagés ..
  3. Arattaon 07 déc 2008 at 21:15

    Merci pour cet article qui éclaire ma lanterne ;) Surtout en ces périodes houleuses de petites guerres entre blogueurs duplicateurs….

  4. SeoManon 07 déc 2008 at 22:38
    @aratta oui des instants houleux en ce moment …le post litigieux a été supprimé par l’auteur du jdb …

    @+

  5. Olivieron 09 déc 2008 at 8:57

    Une question m’intrigue… Aujourd’hui, la sidebar est très génératrice de duplicate content (en effet, d’une page à l’autre, la sidebar est souvent la même). Du coup, lorsque l’on a un article assez court avec une sidebar longue, il aura vite fait d’être détecté comme du duplicate content d’autres articles également courts. Comment éviter cela?

    [WORDPRESS HASHCASH] The poster sent us ‘0 which is not a hashcash value.

  6. SeoManon 09 déc 2008 at 22:28
    @olivier la sidebar contient trés rarement du contenu … plus des widgets javascripts etc..
    mais le cas échéant les bots savent détecter les élements récurrents d’un site et ne sont donc pas vu comme du Duplicate Content…tu peux dormir sur tes deux orielles :)

    Le duplicate content dans un cadre normal est pratiquement impossible à avoir… tu peux faire le test sur des sites Tests et tu verras que c’est compliqué de tomber dans l’un ou l’autre des cas de figures (cf mon post sur le sujet avec des exemples http://bababillgates.free.fr/index.php/le-duplicate-content-ce-nest-pas-du-tout-ce-que-vous-croyez/ )

  7. Olivieron 11 déc 2008 at 12:02

    Bah franchement, depuis que j’ai retiré un certain nombre de widgets de ma sidebar (listing de catégories, etc…), j’ai bcp plus de pages dans l’index primaire de google alors qu’elles étaient avant en duplicate content…

  8. SeoManon 08 fév 2009 at 20:31
    @Olivier - par contre ce qui peut jouer et ce n’est pas du duplicate content c’est le nombre de liens sur votre page : Google Conseille d’avoir moins de 100 liens (entrants et sortants ) les widgets type mybloglog rajoutent un grand nombre de liens.
  9. Thomason 01 juin 2009 at 12:04

    Article intéressant. La pagination des commentaires sur Wordpress est une source de duplicate content mais comment résoudre au mieux ce problème ? Supprimer la pagination ? Laisser la “canonical url” faire son travail ?

  10. Damien Cuvillieron 21 juil 2010 at 8:31

    Matt Cutts fait un bon tour d’horizon du duplicate contents ici : http://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=139394

  11. [...] Google et le Duplicate Content - Via SeoMan [...]

    [WORDPRESS HASHCASH] The comment’s server IP (195.8.66.58) doesn’t match the comment’s URL host IP () and so is spam.

  12. [...] et le Duplicate Content by SeoMan de Bababillgates.free.fr [...]

  13. [...] nouvelle Balise est sensée nous éviter le Duplicate Content qui est le monstre qui hante les nuits des blogueurs ou autres utilisateurs de CMS dynamique [...]