Ceci est une extension à une question connexe répond Hereexpression régulière pour rechercher et remplacer unescaped guillemets non successifs dans le fichier CSV
Je dispose d'un fichier csv hebdomadaire qui doit être analysée. ça ressemble à ça.
"asdf","asdf","asdf","asdf"
Mais parfois, il y a des champs de texte qui contiennent une chaîne double citation non échappée supplémentaire comme celui-ci
"asdf","as "something" df","asdf","asdf"
Des autres postes sur ce site, j'ai pu mettre sur pied un regex
(?m)""(?![ \t]*(,|$))
qui correspond à deux doubles guillemets successifs, seulement "si mma ou fin de ligne devant eux avec éventuellement des espaces et des tabulations entre "
maintenant ne trouve que des guillemets successifs. Comment puis-je le modifier pour trouver et remplacer/supprimer les guillemets autour de "quelque chose" dans le fichier?
merci.
Quelle que soit la langue que vous utilisez, vous avez certainement déjà un analyseur CSV. Avez-vous vérifié si cela est déjà capable de gérer des entrées mal formées? (et vous évite ainsi de réinventer la roue) –
Je n'utilise aucun langage de programmation, cela fait partie d'un processus qui automatise fondamentalement un tas de fichiers pour le traitement par lot quotidien. et le client utilise un programme d'automatisation appelé winautomation qui a essentiellement une action Replace Text intégrée qui accepte l'expression regex de la saveur .NET dans les paramètres find/replace. – stevenjmyu
Ok, bien tout cela aurait dû faire partie de la question - en particulier la partie ".NET regex saveur". –