Comme Paul a dit un Beaucoup d'interprètes robots.txt ne sont pas trop intelligents et pourraient ne pas interpréter les jokers dans le chemin que vous avez l'intention de les utiliser. Cela dit, certains robots tentent d'ignorer eux-mêmes les pages dynamiques, craignant d'être pris dans des boucles infinies sur des liens avec des URLs variables. Je suppose que vous posez cette question parce que vous faites face à un crawler courageux qui essaye dur d'accéder à ces chemins dynamiques.
Si vous rencontrez des problèmes avec des robots d'exploration spécifiques, vous pouvez essayer d'étudier spécifiquement le fonctionnement de ce robot en recherchant sa capacité robots.txt et en spécifiant une section spécifique robots.txt pour celui-ci.
Si vous souhaitez généralement interdire un tel accès à vos pages dynamiques, vous pouvez vouloir repenser votre conception de robots.txt.
Plus souvent qu'autrement, les «pages» de gestion de paramètres dynamiques se trouvent dans un répertoire spécifique ou dans un ensemble spécifique de répertoires. C'est pourquoi il est normalement très simple de simplement Disallow:/cgi-bin ou/app et être fait avec.
Dans votre cas, vous semblez avoir mappé la racine à une zone qui gère les paramètres. Vous pouvez inverser la logique de robots.txt et dire quelque chose comme:
User-agent: *
Allow: /index.html
Allow: /offices
Allow: /static
Disallow:/
De cette façon, votre liste Autoriser priorité sur votre liste de Disallow en ajoutant précisément ce que crawlers devrait indexer. Notez que tous les moteurs de balayage ne sont pas créés égaux et que vous souhaiterez peut-être affiner ce fichier robots.txt à un moment ultérieur en ajoutant une section spécifique pour tout moteur d'exploration qui se comporte mal.
D'après [this] (http://smackdown.blogsblogsblogs.com/2008/05/23/googlebot-creates-pages-instead-of-simply-indexing-them-new-form-crawling-algo-goes -bad /), interdire les pages de recherche peut être une très bonne idée. Cette question est donc très pertinente et ne devrait pas être fermée. –