Merci à tous pour fournir une suggestion sur la question processing of hospital admission data using R, j'ai plus question sur cette question, en fait, il devrait être la tâche avant cette question.traitement des données d'admission à l'hôpital en utilisant R (partie II)
Maintenant, j'ai un ensemble de données comme ceci:
Patient_ID Date Ward
P001 1 A
P001 2 A
P001 3 A
P001 4 A
P001 4 B
P001 5 B
P001 6 B
P001 7 B
P001 7 C
P001 8 B
P001 9 B
P001 10 B
je dois le convertir en:
Patient_ID Date Ward
P001 1 A
P001 2 A
P001 3 A
P001 4 A;B
P001 5 B
P001 6 B
P001 7 B;C
P001 8 B
P001 9 B
P001 10 B
Actuellement je convertir en utilisant ddply
, le code est ci-joint:
data <- ddply(data,
c("Patient_ID", "Date"),
function(df)
{data.frame(Ward=paste(unique(df[,"Ward"]),collapse=";"))
},
.progress="text"
)
Cela peut résoudre mon problème, mais il est très lent (plus de 20 minutes sur un P4 3.2 mac hine) lorsque l'ensemble de données contient 8818 unique(Patients_ID)
et 1861 unique(Date)
. Comment puis-je améliorer cela? Merci!