2010-11-16 14 views
0

J'y suis allé par la poste et votre solution proposée comme - Which web crawler for extracting and parsing data from about a thousand of web sitesEn utilisant Heritrix 1,14

avez installé Heritrix sous /root/heritrix-1.14.4

Coincé à l'export HERITRIX_HOME =/PATH/TO/CONSTRUIT/HERITRIX.

La commande fonctionne silencieusement, mais les résultats cd heritrix_home de $ à

-bash: cd: /root/heritrix-1.14.4/bin/heritrix: pas un répertoire.

Avoir effectué une recherche googlé sans succès.

chmod u + x résultats heritrix_home de $/bin/Heritrix dans chmod: ne peuvent pas accéder `/root/heritrix-1.14.4/bin/heritrix/bin/heritrix ': Pas un répertoire

Votre précieux conseils/pointeurs demandé

+0

Je doute que c'est un bonne idée d'installer dans le répertoire personnel de root. Un meilleur endroit serait/usr/local/heritrix. Un espoir que vous ne l'exécutez pas en tant que root (sauf si absolument nécessaire). – ordnungswidrig

Répondre

1

il ressemble à HERITRIX_HOME est réglé sur /root/heritrix-1.14.4/bin/heritrix où il doit être réglé sur le répertoire /root/heritrix-1.14.4