robots.txt est un dossier des textes qui peut être employé pour limiter des robots de Web à accéder à votre site Web seulement des manières dont vous approuvez.
Ce dossier de robots.txt bloque Imagebot de Google du site Web entier :
Utilisateur-agent : La Googlebot-Image rejettent : /
Pour plus d'information sur robots.txt, lire une norme pour l'exclusion de robot.
Plusieurs outils Web-basés sont disponibles qui rechercheront le dossier de robots.txt de votre site Web et l'examineront pour déceler les erreurs de syntaxe.
Quelques robots de Web épuiseront des quantités considérables de ressources de largeur de bande et de système, tout en renvoyant peu ou pas d'avantage pratique au propriétaire de site Web.
Pour votre convenance, nous maintenons une liste de certains de ces mauvais robots dans le format de robots.txt.
Commentaires