« Optimisez vos Images pour le Referencement et le SEO | Home | 5 Plugins Wordpress Pour mieux Monetiser votre Blog »

sept 10 2008

Comment empécher Google d’indexer tout ou partie de votre Blog

Posté Par SeoMan a 23:09 Dans Referencement, SEO

Première visite ici? Suivez les articles du blog via RSS. Merci pour votre visite!

 robots.txt seo

Alors que ce blog est spécialisé dans le référencement et le SEO, il est utile dans certains cas d’empêcher les robots des moteurs d’indexer votre contenu partiellement ou totalement (Version de développement, Version Pré-Production, Tests Métiers, Contenu Privé, etc..)

Les moteurs indexent tout ce qu’il trouvent sur leur chemin.Voila quelques techniques pour masquer tout ou partie d’un contenu des spiders de Google.

Bloquer toute l’indexation de tout le site

En utilisant le fichier Robots.txt

Pour masquer le site à Google (search) Uniquement :

User-agent: Googlebot
Disallow: /

Pour masquer le site à tous les moteurs de recherche

User-agent: *
Disallow: /

Si vous avez une version https (+gourmande en ressources) et une version http , et vous souhaitez masquer la version https :

sur le robots.txt de la version http

User-agent: *
Allow: /

sur le robots.txt de la version https

User-agent: *
Disallow: /

Masquer un répertoire particulier de votre site web toujours via à vis de Google.

User-agent: Googlebot
Disallow: /Nom_du_Repertoire/

Masquer l’indexation par Google de certains types de fichier (word par exemple)

User-agent: Googlebot
Disallow: /*.doc$

Une Image en particulier

User-agent: Googlebot-Image

Disallow: /image.jpg

Masquer toutes les images au vu de Google Images

User-agent: Googlebot-Image
Disallow: /

En utilisant les Meta Tags

Placer cette meta tag entre votre balise <head> et </head>

<meta name=”robots” content=”noindex, nofollow”>

Pour empêcher l’indexation des images uniquement mais indexer le site :

<meta name=”robots” content=”noimageindex”>

Pas de version de votre site sur le cache de Google

    <meta name=”Googlebot” content=”noarchive”>


cela évite simplement que votre blog se retrouve sur le cache de google, mais n’influe pas sur le réferencement du site.

Supprimer le petit snippet sur les SERPs

<meta name=”googlebot” content=”nosnippet”>

Au delà de l’aspect pratique des ces méthodes ils sont à manier avec précaution sous peine d’empêcher les robots d’accéder complètement à votre blog.

Pour suivre la liste de posts n’hésitez pas à vous abonnez aux flux RSS flux rss seo adsense referencement ou les recevoir directement par Mail 

ou vous pouvez me suivre sur Twitter 

@+

Related Posts Plugin for WordPress, Blogger...


5 Commentaires to “Comment empécher Google d’indexer tout ou partie de votre Blog”

  1. Guillaumeon 11 sept 2008 at 9:11

    Bon petit résumé sur le sujet Seoman.

    En ce qui concerne les blogueurs utilisant Wordpress plusieurs plugins permettent de gérer cela totalement ou en partie, notamment All in one SEO Pack, robots meta ou encore Premium SEO Pack qui propose plus ou moins les fonctionnalités proposées par les 2 extensions précédentes.

    Bonne continuation pour ton blog.

    Dernier Post de Guillaume.Dimension G6 : le buzz de la Volskwagen Golf 6

  2. SeoManon 11 sept 2008 at 21:13
    @guillaume

    merci , le all in one SEO pack est bugué sur certaines versions de wordpress (les dernieres) sinon les autres plugins sont ok
    vive wordpress

  3. Anakinon 09 jan 2009 at 12:44

    @Guillaume - Bonjour Guillaume. Quelle est l’option de “all in one SEO Pack ” dont tu parles stp ?

  4. Quentin12on 10 avr 2009 at 9:19

    En effet, les fichiers robots.txt peuvent être très très utiles. Avant, j’avais un problème parce que toutes les pages de mon site en construction avaient été référenciées ! Du coup j’avais des pages en double, triple, etc … Merci pour ton article qui m’a aidé à comprendre comment ca marchait !

    N.B : J’ai trouvé un autre tuto sympa pour ceux que ca intéresse : http://www.e-tutoriels.com/tutos/tutoriel-Creer-un-fichier-robots-txt-14.html On vous explique comment créer le fichier robots.txt de A à Z

  5. Annonceson 22 août 2009 at 12:10

    Merci pour ce rappel d’informations ! ça ne fait pas de mal de se rafraichir la mémoire sur les robots.txt et les meta parce qu’a chaque fois je me trompe dans les syntaxes !