Est-il possible/pratique de construire une expression régulière unique qui correspond à des données hiérarchiques?expression regex hiérarchique
Par exemple:
<h1>Action</h1>
<h2>Title1</h2><div>data1</div>
<h2>Title2</h2><div>data2</div>
<h1>Adventure</h1>
<h2>Title3</h2><div>data3</div>
Je voudrais finir avec des allumettes.
"Action", "Title1", "data1"
"Action", "Title2", "data2"
"Adventure", "Title3", "data3"
Comme je vois cela nécessiterait de savoir qu'il existe une structure hiérarchique en jeu ici et si je code le modèle pour capturer le H1, il correspond uniquement à la première entrée de cette hiérarchie. Si je ne code pas pour H1 alors je ne peux pas le capturer. Je me demandais s'il y avait des trucs spéciaux que j'emploie pour résoudre cela.
Ceci est un projet .NET.
Dans quelle langue? Regex n'est pas une langue. Il a beaucoup de dialectes différents, dont certains soutiennent ce que vous voulez, et d'autres pas. La plupart ne le font pas. –
Ce n'est pas un bon endroit pour utiliser des expressions régulières, mais un analyseur HTML; En fonction de votre plateforme, nous pouvons en suggérer une bonne. S'il vous plaît modifier votre question et retag il. –
De l'expérience des expressions régulières peuvent être très efficaces pour traiter le HTML dans la nature: D accordé son pas élégant - mais son efficacité pour le temps qu'il faut. –