Il y a neuf ans, quand j'ai commencé à analyser du HTML et du texte libre avec Perl, j'ai lu le classique Data Munging with Perl. Est-ce que quelqu'un sait si David envisage de mettre à jour le livre ou s'il existe des livres ou des pages Web similaires où les nouveaux modules d'analyse comme XML-Twig, Regexp-Grammars, etc, sont expliqués? Je suppose que dans les neuf dernières années certains modules sont encore aussi bons qu'ils l'étaient, certains sont à jour mais avec de nouvelles méthodes intéressantes et certains ont de meilleurs remplacements. Par exemple, est toujours Parse-RecDescent la seule option pour l'analyse de texte libre ou sera le Perl 6 a influencé Regexp-Grammars son remplacement dans de nombreux scénarios?Quels modules Perl sont bons pour la fusion de données?
Cela faisait quatre ans que je n'avais pas de base de données HTML, XML ou de texte libre active avec Perl, donc ma boîte à outils dans ce domaine est probablement un peu obsolète. Par conséquent, toute rétroaction pour la manipulation du HTML et du DOM, l'extraction/la vérification des liens, les tests sur le Web comme Mechanize, la manipulation XML et l'analyse libre du texte des personnes à jour avec les modules CPAN actuels seront les bienvenues.
Quelques nouveautés à ma boîte à outils:
encore dans ma boîte à outils:
- HTML-TableExtract # pas mis à jour depuis 2006
- WWW-Mechanize
- Parse-RecDescent
- HTML-TokeParser
- URI-Escape
- [plus ...]
Certains des détails peut-être changé, mais les concepts sont les mêmes. :) –
Dave, ce serait un plaisir de lire ces commentaires et des recettes un jour sur votre blog. –
Oui, je serais très intéressé par les poste aussi bien. Si vous finissez par poster des mises à jour supplémentaires sur votre blog, ce sera super. À votre santé! – blunders