Je suis en train d'écrire un programme qui lit et sépare les courriels spam et jambon. Maintenant je le lis en utilisant la classe bufferedreader de java. Je suis en mesure d'éliminer toute méthode des caractères indésirables comme « (» ou « » etc, en utilisant replaceAll(). Je veux supprimer les balises HTML aussi, y compris & ampli. Comment y parvenir !?supprimer les balises html de la chaîne en utilisant java
grâce
EDIT: Merci pour la réponse, mais je suis déjà un regex, comment combiner mes deux besoins et mis en un Heres le regex je suis maintenant en utilisant
lines.replaceAll("[^a-zA-Z]", " ")
note:.. Je reçois des lignes de un fichier txt Autres suggestions plss ?!
J'ai essayé Jsoup..but son erreur ne working..no complile, ses tout simplement pas de travail .. – Maverick
Sujets similaires http://stackoverflow.com/questions/1699313/how-to-remove-html -tag-in-java http://stackoverflow.com/questions/240546/removing-html-from-a-java-string –