Je veux utiliser des forêts aléatoires pour la réduction d'attribut. Un problème que j'ai dans mes données est que je n'ai pas de classe discrète - seulement continue, ce qui indique que l'exemple diffère de 'normal'. Cet attribut de classe est une sorte de distance de zéro à l'infini. Est-il possible d'utiliser la forêt aléatoire pour ces données?Comment utiliser les forêts aléatoires R pour réduire les attributs n'ayant pas de classes discrètes?
4
A
Répondre
6
Cela ne devrait pas poser de problème - RF passera simplement en mode de régression. Utilisez la fonction randomForest
à partir du package randomForest
.
Pour obtenir similitude d'objet avec proximity=TRUE
argument, comme:
randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity
Pour obtenir nœud pureté (Indice de Gini comme) l'importance de l'attribut:
randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]
Pour obtenir l'augmentation moyenne MSE (précision de diminution comme) importance de l'attribut:
randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
L'importance de la variable fonctionnerait mieux pour moi que la proximité. Peut-être que la description de mon attribut de classification était un peu trompeuse, mais je sais ce que je devrais explorer. – pixel
Aw, vous vouliez dire variable == attribut ... – mbq
J'ai étendu la réponse pour couvrir cela. – mbq