Je recherche une documentation (documentation officielle si c'est possible) pour les bibliothèques TagSoup et jTidy. Je veux utiliser cette bibliothèque pour manipuler des fichiers "tagsgroup" html qui incluent des tags xml avec différents namespaces mélangés entre des tags html (html, xhtml ou html5).Documentation jTidy et TagSoup
J'ai testé HTMLCleaner, NekoHTML et Jericho, mais je ne trouve pas de documentation pour jTidy et TagSoup, mis à part les exemples les plus simples pour effacer un fichier.
J'ai besoin de manipuler la documentation sur le contenu, remplacer les étiquettes, extraire les informations, etc ...
Merci
Note: Après essai toutes les options, j'ai utilisé StAX/Woodstox:
D id vous considérez [Jsoup] (http://jsoup.org)? Il ne peut pas être fait [mieux/plus facile] (http://stackoverflow.com/questions/3152138/what-are-the-pros-and-cons-of-the-leading-java-html-parsers). Il a aussi un bon [Cookbook] (http://jsoup.org/cookbook/). – BalusC
Je suis en train de tester Jsoup. Elle a l'air facile mais regarde le code d'exemples, elle semble pas sûre de fil. ai-je raison? – angelcervera
Est-ce moi ou Jsoup ne supporte pas le flux de sortie? – slott