Est-ce que quelqu'un a intégré BeautifulSoup avec ASP.NET/C# (éventuellement en utilisant IronPython ou autre)? Y at-il une alternative BeautifulSoup ou un port qui fonctionne bien avec ASP.NET/C#BeautifulSoup et ASP.NET/C#
Le but de la planification à utiliser la bibliothèque est d'extraire texte lisible de toute URL aléatoire.
Merci
Comment puis-je utiliser H AP pour gratter le texte lisible d'une page HTML. Dans BeautifulSoup, c'est très facile à faire. – user300981
J'ai mis à jour ma réponse –
DocumentNode.InnerText obtient tout le texte dans les balises . Mon inquiétude est que je dois supporter ceci pour les URLs qui ne suivent aucune norme. Il pourrait y avoir de la crasse partout. HAP est assez intelligent pour distinguer entre le texte lisible et les balises HTML non pertinentes, les commentaires, les scripts clients – user300981