J'aimerais récupérer une page Web comprenant des images, des animations flash et d'autres objets incorporés. Quel est un moyen simple d'y parvenir?Récupération d'une page Web incluant des objets incorporés
2
A
Répondre
2
Ecriture d'un robot d'exploration Web dans le langage de programmation Java. http://java.sun.com/developer/technicalArticles/ThirdParty/WebCrawler/
1
Utilisez une open source HTML Parser telle que HTMLCleaner - http://java-source.net/open-source/html-parsers/htmlcleaner ou CyberNekoHtml - http://java-source.net/open-source/html-parsers/nekohtml. Une fois que vous avez utilisé un analyseur pour créer une représentation du DOM de la page Web, vous pouvez charger/télécharger des images et autres objets incorporés qui existent dans le DOM en effectuant des requêtes sur le DOM et en extrayant les attributs src pertinents de les éléments HTML.
1
essayer web-harvest
En fait, il serait plus simple de choisir un. J'espère que quelqu'un va ajouter une réponse qui énumère de bonnes alternatives. –