2010-03-27 4 views
2

Y at-il une option dans le pack d'agilité html qui peut analyser la balise qui est comme dans les &lt et &gt.Option dans le pack d'agilité Html qui analysent la balise `& lt table & lt`

S'il existe une balise comme <table> alors le pack d'agilité html analyse correctement les informations de la table de balises.Mais si la balise est comme &lt table &lt, elle n'analyse pas les informations de la table de balises ici. Donc, toute option est là dans le pack d'agilité html qui analysent également les informations de ces balises.

Répondre

1

Non, il n'y a pas une option pour faire cela autant que je sache, mais vous devriez être en mesure d'utiliser Server.HtmlDecode() pour transformer ces caractères en vraies parenthèses.

Où est votre code venant de, un fichier sur votre serveur ou récupéré via une URL? Je demande juste parce que je ne pense pas que vous seriez capable d'utiliser la classe HtmlWeb pour récupérer le HTML parce qu'il le transforme en HtmlDocument avant que vous puissiez mettre la main dessus. Au lieu de cela, vous devez utiliser la classe de bibliothèque .net HttpWebRequest pour récupérer le code HTML et le charger directement dans un HtmlDocument avec HtmlDocument.Load();

J'ai écrit un article qui montre comment charger une chaîne en HtmlDocument ici:

1

Vous pouvez le faire en remplaçant & lt à < et & lt à>. Ensuite, vous pouvez utiliser html agility pack pour l'analyser.