2010-07-19 10 views

Répondre

0

Je vous suggère de supprimer d'abord toutes les étiquettes, puis d'épeler le texte qui en résulte. C'est ce que font les éditeurs wysiwyg html basés sur inweb.

Dépouiller balises html: http://en.csharp-online.net/Strip_all_HTML_tags

1

Pour extraire le texte de HTML utiliser le HTML Agility pack. Il y a également eu du travail open source pour la vérification orthographique HTML sur Codeplex: voir le projet Spello.