Puis-je intégrer le crawler Apache Nutch au serveur Solr Index?Utilisation du crawler Nutch avec Solr
Edit:
L'un de nos devs est venu avec une solution de ces postes
Réponse
Oui
Puis-je intégrer le crawler Apache Nutch au serveur Solr Index?Utilisation du crawler Nutch avec Solr
Edit:
L'un de nos devs est venu avec une solution de ces postes
Réponse
Oui
Il s'agit toujours d'un open issue. Si vous vous sentez aventureux, vous pouvez essayer d'appliquer ces patches vous-même, bien qu'il ressemble à it's not so simple
Si vous êtes prêt à passer à nutch 1.0, vous pouvez utiliser le solrindex comme décrit dans cet article par Lucid Imagination: http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/.
ya thats l'article définitif pour nutch/solr –
La version 2.x est conçue pour utiliser solr par défaut. Vous pouvez suivre les étapes dans http://wiki.apache.org/nutch/Nutch2Tutorial, ou une meilleure instruction dans le livre "Web Crawling et Data Mining avec Apache Nutch".
ya Je prépare une discussion de groupe d'utilisateurs sur Lucene alors je vais tester cette configuration. J'espérais qu'il y avait une réponse Y/N rapide là-bas –