2010-10-07 13 views
0

Peut wget être utilisé pour obtenir tous les fichiers sur un server.Suppose si cela est la structure de répertoire en utilisant le framework Django sur mon site foo.comPeut-on utiliser wget pour obtenir tous les fichiers sur un serveur?

Et si cela est la structure du répertoire

  /web/project1 
      /web/project2 
      /web/project3 
      /web/project4 
      /web/templates 

Sans connaissant le nom des répertoires de /project1,project2.....Il est possible de télécharger tous les fichiers

+0

voir http://stackoverflow.com/questions/273743/using-wget-to-recursively-fetch-a-directory-with-arbitrary-files-in-it – Jayan

Répondre

0

try recursive retrieval - l'option -r.

+0

Pouvez-vous donner un exemple? J'ai essayé l'option -drc .Mais pas sûr – Rajeev

+0

Aussi, si cela est autorisé, il s'agirait d'un problème de sécurité. – Rajeev

+0

La plupart des serveurs Web vous permettent de spécifier si la structure de répertoire peut être énumérée ou non. – Jason

1

Vous pouvez utiliser

wget -r -np http://www.foo.com/pool/main/z/ 

-r (extraction des fichiers/dossiers récursive)

np (ne pas la descente répertoire parent lors de la récupération récursive)

ou

wget -nH --cut-dirs=2 -r -np http://www.foo.com/pool/main/z/ 

--cut-dirs (ce qui rend Wget non t "voir" les numéros des composants du répertoire distant)

-nH (l'appel de Wget avec -r http://fly.srk.fer.hr/ créera une structure de répertoires commençant par fly.srk.fer.hr/. Cette option désactive un tel comportement.)

1

Tout d'abord, wget ne peut être utilisé que pour extraire les fichiers servis par le serveur Web. La question que vous posez ne précise pas si vous voulez dire des fichiers ou des pages Web. Je devine de la façon dont vous avez formulé votre question que votre intention est de télécharger les fichiers du serveur, pas les pages Web desservies par Django. Si c'est correct, alors wget ne fonctionnera pas. Vous devez utiliser quelque chose comme rsync ou scp.

Si vous voulez utiliser wget pour récupérer toutes les pages générées depuis Django, cela ne fonctionnera que si les liens pointent vers ces répertoires. Donc, vous avez besoin d'une page qui a le code comme:

<ul> 
<li><a href="/web/project1">Project1</a></li> 
<li><a href="/web/project2">Project2</a></li> 
<li><a href="/web/project3">Project3</a></li> 
<li><a href="/web/project4">Project4</a></li> 
<li><a href="/web/templates">Templates</a></li> 
</ul> 

wget n'est pas un psychique; il ne peut tirer que les pages qu'il connaît.