J'ai besoin de tokenizer balise suivante:Comment analyser une étiquette comme Xml avec l'expression régulière
{TagName attrib1=”value1” attrib2=”value 3”}.
Je voudrais écrire regex de le faire, mais le problème est que la valeur d'attribut peut contenir espace, Je ne peux pas juste diviser avec l'espace.
[Vous ne devriez vraiment pas essayer d'analyser XML avec des expressions régulières] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454# 1732454). – eliah
Vous avez besoin d'un vrai analyseur. Vous pouvez en écrire un vous-même en utilisant 'indexOf' (c'est juste une machine d'état avec une pile, après tout), mais mieux vaut utiliser un générateur d'analyseur syntaxique tel que Antlr: http://www.antlr.org/ – Anon
les étiquettes ne sont pas composées et c'est à peu près aussi compliqué que ça, donc j'ai pensé que ça pourrait être un peu plus simple que du Xml complet ... – Dan