2010-02-08 1 views
4

J'ai une liste de vecteurs de caractères dans R qui représente des ensembles de mots cooccurrents. A partir de là, je voudrais extraire un vecteur de caractère capturant tous les mots qui apparaissent dans la liste des vecteurs de caractères. Je pense savoir comment passer efficacement d'un vecteur de mots à un vecteur de caractère unique des mots apparus. Ce que je ne sais pas comment faire est de réduire efficacement la liste des vecteurs de caractères en un seul vecteur de caractères. Tous les conseils sur la façon d'aborder ce problème ou le problème global serait grandement apprécié!Identification des termes uniques de la liste des vecteurs de caractères

Répondre

10

Utilisation unlist():

> x <- list(l1=c("a","b","c"), l2=c("b","d")) 
> unlist(x) 
l11 l12 l13 l21 l22 
"a" "b" "c" "b" "d" 

Et pour obtenir les valeurs uniques, il suffit d'utiliser unique:

> unique(unlist(x)) 
[1] "a" "b" "c" "d" 
+0

Excellent, merci Shane! – Chris