2009-10-29 8 views
2

J'ai configuré 'Nutch search engine' pour explorer des sites Web. Maintenant, j'ai besoin d'écrire une API PHP pour parler au moteur de recherche Nutch. je dois faire 2 choses:Quelqu'un a-t-il travaillé avec une API PHP pour lire les résultats de l'analyse 'Nutch search engine'?

  1. en utilisant un script PHP que je dois préciser à Nutch à laquelle URL à explorer (pour cela, j'ai quelques pointeurs de http://www.cs.sjsu.edu/faculty/pollett/masters/Semesters/Fall07/sheetal/?Deliverable2.html

  2. en utilisant un script PHP Je dois récupérer le résultat d'analyse de la DB crawl Nutch. Je ne peux pas semble trouver de l'aide sur ce (ou je pourrais être trop bête pour voir la réponse si elle est déjà là :()

Si quelqu'un a utilisé une API PHP pour lire les résultats de l'analyse de Nutch, veuillez partager quelques pointeurs avec moi.

Vous attendez désespérément de l'aide.

Répondre

0

Je suis à la recherche d'un bon moyen de le faire aussi. Mais à partir de maintenant, Im utilisant une API JSP pour afficher les résultats de la recherche. This devrait vous démarrer.

Vous pouvez également utiliser php pour recevoir vos résultats en tant qu'objets JSON.

Pour vous lancer dans cette direction, il y a un intéressant page pour vous lancer sur JSON en utilisant jquery. Google pour d'autres tutoriels sur JSON. Il y en a beaucoup.

0

Pour votre question # 1, vous devez injecter ces URL au robot d'exploration. Relativement simple: + créer un fichier avec les URL que vous souhaitez ajouter + question injectent commande avec de ces URL (peut-être besoin d'attendre la fin de l'analyse précédente/fetch/cycle d'index) + démarrer une nouvelle exploration

Remarque: vous devez vous assurer que les URL ne sont pas filtrées ainsi

-1

en ce qui concerne # 2, Nutch est écrit en JSP & Java, je ne connais aucune implémentation PHP (si vous trouvez que je suis intéressé). Donc, fondamentalement, vous avez envie de créer un type de communication AJAX ou SOAP entre votre script PHP et le serveur Nutch. Avez-vous essayé la liste de diffusion nutch pour obtenir de l'aide?

+0

ce n'est pas ansewr! vous devriez le faire commenter. –

0

vous devez utiliser solr pour la recherche ou d'une autre plate-forme de recherche, nutch est juste un robot, l'idée est simple:

  • ==> nutch pour l'exploration
  • ==> solr pour créer un index
  • ==> construire une interface pour rechercher dans l'index (étape 2). J'ai utilisé SolariumBundle pour cette étape