OK je donc redéfinie mon dernier programme ... la voici:Java - Lire un site et non la source
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
public class asp {
public static void main(String[] args) {
try {
URL game = new URL("http://localhost/mystikrpg/post.php?players");
URLConnection connection = game.openConnection();
BufferedReader in = new BufferedReader(new
InputStreamReader(connection.getInputStream()));
String inputLine;
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
}
in.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
Le problème? Quand je le lance ... je reçois la page ENTIER ... MÊME LA SOURCE DE CODE comme le début de la balise html jusqu'à la fin du corps et la balise html.
Quand vraiment ... Je veux à la sortie est le 1 .... La seule façon je peux le voir est si je divise la chaîne de <body>
et </body>
...
Meh. Aidez-moi?
À quoi ressemble le site que vous analysez? Postez la source – bwawok
si vous ne voulez pas la source que voulez-vous? Thats ce que la page "est" –
La source est le site Web. Les navigateurs Web font beaucoup de travail pour normaliser la source reçue à partir d'une demande donnée et la formater d'une manière agréable pour l'utilisateur. Vous devrez aussi analyser le DOM HTML pour extraire les données que vous voulez. –