2010-06-22 11 views
1

Je crée un site qui va avoir une base de données d'article wiki. À l'heure actuelle, il n'y a pas de liens dans les articles wiki autres que l'utilisation du moteur de recherche sur le site.Comment obtenir une base de données wiki dans les moteurs de recherche?

Comment puis-je faire en sorte que Google et les autres moteurs de recherche Internet utilisent ces articles? Il y a beaucoup trop d'articles dans la base de données pour inclure directement des liens à tous sauf s'il s'agit d'un type de carte de site automatisée.

Sur beaucoup de wikis, j'ai vu un bouton de page aléatoire; Je n'ai jamais vu le point de ceux-ci moi-même en tant qu'utilisateur, sont-ils là pour aider les robots des moteurs de recherche?

Répondre

2

Vous pouvez écrire un script PHP ou ASP qui génère un sitemap et rediriger les demandes vers /sitemap.xml vers ce script.

Vous pouvez ensuite envoyer le plan du site à Google en utilisant leur Webmaster Tools.

+0

Est-ce ainsi que la plupart des sites le font? Il me semble que cela pourrait vraiment battre ma base de données. Je vais probablement avoir environ 2 millions d'articles dans la base de données, et il semble assez pénible de générer dynamiquement un nouveau sitemap. Ou quelque chose de plus fréquent que tous les jours ou plus. –

+0

Si vous souhaitez réduire l'accès à la base de données, vous pouvez mettre en cache le sitemap et ne le mettre à jour que toutes les semaines. Fondamentalement, quand quelqu'un demande le plan du site, vérifiez si sa date de dernière modification a plus d'une semaine, et si c'est le cas, régénérez-le. Sinon, servez la version en cache. Avec les systèmes DB modernes, 2 millions d'articles peuvent être manipulés assez facilement. – robinjam

2

Créer un XML sitemap.

Le protocole Sitemaps permet à un webmaster d'informer les moteurs de recherche sur les URL sur un site Web qui sont disponibles pour l'analyse.

2

Soumettez un Sitemap à google. Utilisez Google Webmaster Tools pour ajouter votre site et générer automatiquement un sitemap.xml compressé. Cela indiquera à Google toutes les URL de votre site afin qu'il puisse les explorer. Vous pouvez également surveiller la fréquence d'exploration de votre site par Google et détecter toute erreur éventuelle.

EDIT: Si vous craignez que le sitemap soit trop volumineux, vous pouvez générer un sitemap avec une seule URL pointant vers une page d'index principal. Cette page d'index peut être générée une fois par jour ou une demande et peut être segmentée comme bon vous semble. Il agit simplement comme la source d'une exploration Google. Par exemple, il pourrait présenter une liste de caractères A, B, C, D, E, ..., Z qui sont des liens vers des pages qui contiennent une liste de toutes les pages commençant par ce caractère. Peu importe, cependant vous voulez le faire pour optimiser vos ressources de base de données. Ils ont pour clé d'obtenir un sitemap.xml dans le système de Google afin qu'ils sachent quand et à quelle fréquence vous explorer. Il y a toutes sortes de complexités pour générer un sitemap. L'approche ci-dessus avec une URL est brute, mais cela peut fonctionner. Idéalement, vous générez un sitemap avec toutes les URL de votre système triées par priorité, mais cela n'est pas nécessaire.

Examinez la spécification du sitemap pour plus d'informations. Si vous voulez juste semer Google, utilisez l'approche 1 URL pour y aller.