Je travaille sur l'optimisation de mon site pour le moteur de recherche de Google, et récemment, j'ai remarqué que lorsque je fais une requête "site: www.joemajewski.com", j'obtiens des résultats pour les pages qui ne devrait pas être indexé du tout.SEO Aide avec les pages indexées par Google
Jetons un coup d'oeil à cette page, par exemple: http://www.joemajewski.com/wow/profile.php?id=3
J'ai créé mon propre CMS, ce qui est tout simplement une ventilation des statistiques de l'ID utilisateur # 3, que je remarqué est indexé par Google, bien qu'il shouldn ne sois pas. Je comprends qu'il faut un certain temps avant que les résultats de Google reflètent fidèlement le contenu de mon site, mais cela n'a pas été correctement indexé depuis près de six mois.
Voici les précautions que je prises:
Mon fichier robots.txt
a une ligne comme celui-ci:
Disallow: /wow/profile.php*
Lorsque vous exécutez l'URL via Google Webmaster Tools, il indique que je l'ai fait, en effet, créer correctement la commande disallow. Il a toutefois indiqué qu'une page qui n'est pas explorée peut toujours s'afficher dans les résultats de la recherche si elle est liée. Ainsi, j'ai pris une précaution de plus.
Dans le code source I inclus les méta-données suivantes:
<meta name="robots" content="noindex,follow" />
Je suppose que follow
signifie utiliser la page pour le calcul de PageRank, etc., et l'noindex
indique à Google à pas afficher la page dans les résultats de la recherche.
Cette page, profile.php, est utilisée pour prendre le $ _GET ['id'] et trouver l'utilisateur enregistré correspondant. Il affiche un peu d'informations sur cet utilisateur, mais n'est pas suffisamment pertinent pour justifier une affichage dans les résultats de recherche, c'est pourquoi j'essaye d'empêcher Google de l'indexer.
Ce n'est pas la seule page que Google indexe que je voudrais supprimer. J'ai aussi un blog WordPress, et il y a beaucoup de pages de catégories, de pages de balises et de pages d'archives que je voudrais supprimer, et je suis en train de faire les mêmes procédures pour essayer de les supprimer. Est-ce que quelqu'un peut expliquer comment obtenir des pages supprimées des résultats de recherche de Google, et peut-être quelques critères qui devraient aider à déterminer quels types de pages que je ne veux pas indexés. En termes de mon blog WordPress, les seules pages que je veux vraiment indexées sont mes articles. Tout ce que j'ai essayé de bloquer, avec peu de chance de la part de Google. Quelqu'un peut-il également expliquer pourquoi il est mauvais d'avoir des pages indexées qui ne fournissent aucun contenu nouveau ou pertinent, comme des pages pour des tags ou des catégories WordPress, qui ne vont clairement jamais recevoir de trafic de Google.
Merci!