2009-11-22 40 views
3

J'essaie de faire l'analyse des composantes principales dans R. Il y a 2 façons de le faire, je crois. On fait tout de suite l'analyse des composantes principales en normalisant d'abord la matrice en utilisant s = scale (m), puis en appliquant l'analyse en composantes principales.
Comment savoir quel résultat est le meilleur? Quelles valeurs en particulier dois-je regarder. J'ai déjà réussi à trouver les valeurs propres et les vecteurs propres, la proportion de variance pour chaque vecteur propre en utilisant les deux méthodes. J'ai remarqué que la proportion de la variance pour le premier pca sans standardisation avait une valeur plus grande. Y a-t-il un sens à cela? N'est-ce pas toujours le cas? Enfin, si je suis supposé prédire une variable, c'est-à-dire un poids, dois-je abandonner la variable, c'est-à-dire le poids de ma matrice de données, lorsque je fais une analyse en composantes principales?comment dire s'il est préférable de normaliser votre matrice de données en premier lorsque vous effectuez l'analyse en composantes principales dans R?

+0

Je pense que cela dépend de ce que vous entendez par «mieux», et je ne suis pas sarcastique ou dédaigneux, juste en soulignant, je ne sais pas s'il y a une réponse facile jusqu'à ce que la question à l'étude est (comme hadley échappe à) –

Répondre

3

Vos variables sont-elles mesurées sur une échelle commune? Si oui, ne pas mettre à l'échelle. Si non, alors c'est probablement une bonne idée de mettre à l'échelle.

Si vous essayez de prédire la valeur d'une autre variable, PCA n'est probablement pas le bon outil. Peut-être que vous devriez plutôt regarder un modèle de régression.

+0

mais comment savoir si mes variables sont mesurées sur une échelle commune? – justR