Je doute dans nutch alors que je l'ai utilisé le wiki je me demande de modifier le crawl-urlfilter.txt
comment faire nutch crawler crawl
+^http://([a-z0-9]*\.)*apache.org/
et je me demande de créer un dossier url et une liste d'URL. ..
ai-je besoin de créer tous les liens dans crawl-urlfilter.txt
et dans la liste des url ...