2010-10-08 18 views
0

Je dois vérifier si un document HTML est correct, si toutes les balises et attributs sont corrects (en C#). Si ce n'est pas le cas, essayez de corriger les balises et/ou les attributs malformés. Des suggestions pour une bibliothèque ou un outil que je peux utiliser?Validation HTML/correction en C#

Merci.

+1

Vous devriez commencer par regarder le [HTML Agility Pack] (http://htmlagilitypack.codeplex.com/) –

+0

Alors que le HtmlAgilityPack va analyser et montrer des erreurs, il ne va pas aussi loin que j'ai pu le découvrir, Fixe-les pour toi. Par conséquent, j'ai aussi regardé TidyManaged. Cependant, je ne peux pas l'obtenir pour fonctionner ou travailler sur un environnement .net 4.5 64 bits, il dit juste "Une tentative a été faite pour charger un programme avec un format incorrect. (Exception de HRESULT: 0x8007000B)" - Des pointeurs sur ce qu'il faut faire ? –

Répondre

5

Tidy Managed résolu mes problèmes. Cet outil sait réparer les étiquettes cassées et fermer les étiquettes. Créez l'application TidyManaged et téléchargez le fichier libtidy.dll et placez-le dans le fichier bin/debug.

+0

Ne prend pas en charge les caractères Unicode (tels que l'arabe) –