J'ai un assez grand fichiers csv (1.2gb ... grand à la RAM de 2 Go sur un de mes ordinateurs). Pour chaque entrée dans une colonne, je voudrais ajouter "1C" afin que je puisse joindre/fusionner avec une autre table de données/db.Ajouter le suffixe à la colonne des entrées dans le fichier csv (ou dans la base de données SQLite)
Si le fichier n'était pas si grand, il serait facile d'utiliser read.csv
pour importer à data
puis utiliser data$symbol <- paste(data$symbol, "1C", sep="")
. Mais maintenant, je reçois l'avertissement can't allocate vector of size x
.
Est-ce une solution manuelle, comme scan()
, ma seule option? (J'ai un peu peur de corrompre mes données) Merci!
@Joshua - Merci pour le lien! Mais après avoir récupéré tout le csv en RAM, je n'ai pas assez de mémoire pour me coller à lui-même (même avec une boucle élément par élément). Avant de faire la fusion, je sélectionne juste quelques colonnes de la base de données SQLite qui contient mes données, donc il n'y a pas de problème de mémoire. Je préférerais ajouter le "1C" avant d'ajouter le csv à la base de données pour que je puisse y faire un "join" au lieu d'un 'merge' dans R. Merci! –
@Joshua - Je suis soit sur Ubuntu ou OSX, donc je vais essayer! –
@Joshua - Merci! Exactement ce que je cherchais! Je suis toujours un nub à Linux, donc j'ai besoin de creuser plus dans ces outils de base! –