J'essaie d'écrire une expression régulière qui remplace les sauts de ligne entre certaines zones d'un fichier texte, mais uniquement en mode plain. contenu textuel (c'est-à-dire exclut le texte à l'intérieur du contenu de l'attribut HTML, comme href) mais n'a pas beaucoup de chance après la première partie.Expression régulière pour remplacer les sauts de ligne avec un espace uniquement si la rupture ne figure pas dans le contenu d'un attribut HTML
entrée Exemple:
AUTHOR: Me
DATE: Now
CONTENT:
This is an example. This is another example. <a href="http://www.stackoverflow/example-
link-that-breaks">This is an example.</a> This is an example. This is yet another
example.
END CONTENT
COMMENTS: 0
sortie Exemple:
AUTHOR: Me
DATE: Now
CONTENT:
This is an example. This is another example. <a href="http://www.stackoverflow/example-link-that-breaks">This is an example.</a> This is an example. This is yet another example.
END CONTENT
COMMENTS: 0
Donc, idéalement, un espace remplace les sauts de ligne si elles se produisent dans le texte brut, mais les enlève sans ajouter d'espace si elles sont à l'intérieur Paramètres HTML (principalement href, et je vais bien si je dois le limiter).
Quelle langue/outil utilisez-vous? Par exemple, Perl, PHP, Java, Notepad ++ ...? –
Je vais utiliser n'importe quoi, j'ai une configuration XAMPP donc PHP est bien, ou je peux installer Notepad ++. Les fichiers sont assez volumineux (25mb-150mb) si c'est une considération. –
Ne vous embêtez pas avec Notepad ++; sa saveur regex (héritée de SciTE) est terriblement limitée. Je l'ai jeté dans le pire des cas. ;) PHP ira bien. –