2010-08-04 13 views
1

Je prépare des tests de performances personnalisés pour une application héritée qui génère des codes HTML non standards (balises manquantes, citations en double, devis manquants, les travaux) qui ne peuvent pas être modifiés pour toutes les raisons habituelles.Bibliothèque similaire à BeautifulSoup et "HTML Agility Pack" mais pour C ou Java?

Je recherche une bibliothèque similaire à BeautifulSoup ou "HTML Agility Pack" qui peut être appelée depuis C ou Java sur un hôte UNIX.

Nous construirons quelques échafaudages de test, puis commencerons à les redessiner et à les réimplémenter, mais j'ai d'abord besoin de quelques mesures de base.

Répondre

0

jsoup - http://jsoup.org/

jsoup: Java HTML Parser jsoup est une bibliothèque Java pour travailler avec HTML dans le monde réel. Il fournit une API très pratique pour extraire et manipuler des données, en utilisant les meilleures méthodes DOM, CSS et jquery.