Je suis encore un peu nouveau sur RegEx en général. J'essaie de récupérer les noms d'un champ afin que je puisse les séparer pour une utilisation ultérieure (en utilisant Pentaho Data Integration/Kettle pour l'extraction de données). Voici un exemple de la chaîne on me donne:RegEx pour supprimer le texte indésirable
CN=Name One/OU=Site/O=Domain;CN=Name Two/OU=Site/O=Domain;CN=Name Three/OU=Site/O=Domain
Je voudrais avoir le format suivant retourné:
Name One;Name Two;Name Three
Kettle utilise Java expressions régulières.
Je serai en mesure de séparer les données dans une autre étape avec PDI. Je veux juste faire le nettoyage initial. – OpenDataAlex
Je viens de vérifier la documentation sur http://wiki.pentaho.com/display/EAI/Regex+Evaluation - il semble que leur implémentation de la substitution de regexp soit assez limitée. La regex que vous voulez obtenir un seul nom est CN = ([^ \ /] *), mais je ne vois pas d'option pour un drapeau "g" lobal pour obtenir tous les noms. - Vous pouvez essayer: (CN = ([^ /] *) [^;] *;) *, puis activer les champs Créer pour les groupes de capture. – Sec
Cette dernière exp m'a laissé avec juste le texte après le dernier point-virgule. Y arriver si = p – OpenDataAlex