Je travaille sur # énormes # fichiers texte (de 100mb à 1gb), je dois les analyser pour extraire des données particulaires. Le plus ennuyeux est que les fichiers n'ont pas de séparateur clairement défini.Séparateur incertain, analyse d'un journal désordonné avec sed
Par exemple:
"element" 123124 16758 "12.4" "element" "element with white spaces inside" "element"
Je dois supprimer les espaces blancs dans les chaînes limitées par "(citation), le problème est que je ne dois pas effacer les espaces blancs « en dehors » les citations (sinon quelques chiffres fusionnerait) Je ne peux pas trouver une solution décente sed, quelqu'un peut-il m'aider avec cela?
Cela a résolu mon problème. Juste une dernière demande, pouvez-vous s'il vous plaît m'expliquer le code? Merci beaucoup (je ne suis pas familier avec awk) – Abaco
en définissant des guillemets doubles comme séparateur de champ, ces mots à l'intérieur des citations ont des numéros de champ qui sont pairs. Donc le compteur 'i' augmente de 2.' gsub() 'remplace tous les espaces par null. SVP lire le manuel gawk (recherche GNU awk) pour plus d'infos – ghostdog74
+1 solution très astucieuse. –