Glossaire · Glossaire
Meta robots
Les directives meta robots indiquent aux crawlers compatibles comment indexer ou afficher une page donnée.
Meta robots s’utilise dans le HTML d’une page pour envoyer des instructions comme index, noindex, follow ou nofollow. Une version équivalente peut aussi être envoyée via un en-tête HTTP.
Pourquoi c’est important
Cela permet de contrôler l’indexation page par page sans bloquer complètement l’accès du crawler au contenu.
Différence avec les notions proches
Meta robots est lu après l’accès à la page. Robots.txt peut empêcher cet accès, tandis que canonical suggère une URL représentative différente.
Exemple
Une page de recherche interne peut rester accessible aux utilisateurs tout en demandant à ne pas apparaître dans les résultats.
<meta name="robots" content="noindex,follow" />
Comment les équipes l’utilisent
Les équipes le vérifient dans les templates, pages temporaires, PDF et réponses HTTP pour éviter que brouillons ou doublons entrent dans l’index.
Malentendu fréquent
Ce n’est pas une protection d’accès. Si une page est privée, elle doit être protégée; noindex parle seulement aux crawlers compatibles.
Lire ensuite
Utilisez ces parcours pour passer de la definition aux notions proches, groupes thematiques et guides.