Les robots, crawlers des moteurs ne respectent plus rien…

C’est bien la question que l’on peut se poser aujourd’hui…

La balise meta robots  (<meta name= »robots » content= »… » />) qui a pour vocation de dire en théorie ce que doivent faire les robots des moteurs de recherche en arrivant sur une page semble ignorée.

En effet certains webmasters ont noté que le robot de Live Search (MSN) visitait ces pages et permettait l’indexation de ces dernières malgré que cette balise <meta name= »robots » content= »noindex » /> lui donne l’ordre inverse.

+ d’infos sur le blog Oseox Live ne respect pas le noindex

Même Google reconnaît avoir des ratés à ce niveau (Faute avouée, à demi pardonnée) .

+  d’infos ici : Balises meta pour bloquer…

Dans l’index de Google il ne serait donc pas rare de voir certaines de ces pages indexées…

Et du coté de Yahoo ! ? aucun accident d’indexation ne semble avoir été recensé pour le moment (du moins mes recherches n’ont abouti à rien à ce sujet)

Que faut-il faire alors pour bien se couvrir, pour préserver un contenu que l’on aimerait voir apparaître à un moment précis et non pas quand les moteurs de recherche le décident ? (non mais, on n’est plus chez soi)

Doublez votre « interdiction » en précisant cela dans un fichier robots.txt placé à la racine de votre site. Deux protections valent mieux qu’une.

+ d’infos ici :Bien construire son fichier robots.txt

Si vous devez absolument mettre ces pages en ligne :

– Ne pas lier ces pages à votre site (pages orphelines) et ne pas faire de liens (d’autres sites) vers elles.

– Mettre un password pour parer à la visite d’un internaute perdu sur le web qui tomberait malencontreusement sur ces pages.

– Enfin, la meilleure des parades à mon avis, c’est de garder vos pages en local le temps qu’elles soient finalisées.

Un retour d’expérience à ce sujet ? n’hésitez pas à nous laisser un commentaire.


4 Responses to “Les robots, crawlers des moteurs ne respectent plus rien…”