J'ai un fichier texte qui contient des données dans les balises {[]}. Quel serait le moyen suggéré pour analyser ces données afin que je puisse simplement utiliser les données à l'intérieur des balises?Analyse des éléments à partir du fichier texte
Exemple de fichier texte ressemblerait à ceci:
«c'est un tas de texte qui n'est pas {[vraiment]} utile dans tout {[façon]}. Je dois {{obtenir}} des éléments {[de]} ça. '
Je voudrais finir avec 'vraiment', 'manière', 'obtenir', 'de' dans une liste. Je suppose que je pourrais utiliser split pour le faire .. mais il semble qu'il pourrait y avoir un meilleur moyen de sortir. J'ai vu une tonne de bibliothèques d'analyse, y en a-t-il une qui serait parfaite pour ce que je veux faire?
Wow, c'était rapide .. et parfait. Merci! – chris
@chris: soyez prudent avec ceci: il capture uniquement les caractères alphanumériques entre les délimiteurs. Si vos données ont d'autres sortes de caractères, cela ne les ramassera pas. –
Pour exposer le commentaire de Bryan, les cas spécifiques de: mots césure, {[anti-guerre]}; mots composés avec des espaces, {[New England]}; noms de lieux ou de personnes qui utilisent la ponctuation et les espaces, {[Boston, MA]}, {[George W. Bush]}. – tgray