J'essaie de télécharger des pages distantes. Dans le code source, il y a une très longue ligne. Les deux curl et wget télécharger le fichier, mais décidez de manquer cette ligne. Y at-il un autre utilitaire de ligne de commande que je peux utiliser et/ou quelqu'un sait comment je peux résoudre ce problème. Puis-je clarifier, j'ai essayé avec wget et curl et les deux fichiers manquent la ligne.Téléchargement bizarre de page web en utilisant wget et curl
Edit:
[[email protected] scripts]$ curl --version
curl 7.15.5 (x86_64-redhat-linux-gnu) libcurl/7.15.5 OpenSSL/0.9.8b zlib/1.2.3 libidn/0.6.5
Protocols: tftp ftp telnet dict ldap http file https ftps
Features: GSS-Negotiate IDN IPv6 Largefile NTLM SSL libz
[[email protected] scripts]$ wget --version
GNU Wget 1.11.4 Red Hat modified
Copyright (C) 2008 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later
<http://www.gnu.org/licenses/gpl.html>.
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
Originally written by Hrvoje Niksic <[email protected]>.
Currently maintained by Micah Cowan <[email protected]>.
Comment savez-vous que la ligne est vraiment là? – recursive
Je vais à http: //monsite.com/page.html ... voir le code source ... – Simon
Si vous visualisez la source DOM en utilisant un navigateur, ce n'est peut-être pas la même chose que ce qui est dans le réel source téléchargée du serveur. Javascript, par exemple, peut transformer le document après qu'il a été téléchargé. – recursive