J'ai besoin d'un exemple descriptif montrant comment faire une classification SVM 10 fois sur un ensemble de données à deux classes. Il y a juste un exemple dans la documentation de MATLAB mais ce n'est pas avec 10 fois. Est-ce que quelqu'un peut m'aider?Exemple de classification SVM 10 fois dans MATLAB
20
A
Répondre
39
Voici un exemple complet, en utilisant les fonctions suivantes de la Boîte à outils bio-informatique: SVMTRAIN, SVMCLASSIFY, CLASSPERF, CROSSVALIND.
load fisheriris %# load iris dataset
groups = ismember(species,'setosa'); %# create a two-class problem
%# number of cross-validation folds:
%# If you have 50 samples, divide them into 10 groups of 5 samples each,
%# then train with 9 groups (45 samples) and test with 1 group (5 samples).
%# This is repeated ten times, with each group used exactly once as a test set.
%# Finally the 10 results from the folds are averaged to produce a single
%# performance estimation.
k=10;
cvFolds = crossvalind('Kfold', groups, k); %# get indices of 10-fold CV
cp = classperf(groups); %# init performance tracker
for i = 1:k %# for each fold
testIdx = (cvFolds == i); %# get indices of test instances
trainIdx = ~testIdx; %# get indices training instances
%# train an SVM model over training instances
svmModel = svmtrain(meas(trainIdx,:), groups(trainIdx), ...
'Autoscale',true, 'Showplot',false, 'Method','QP', ...
'BoxConstraint',2e-1, 'Kernel_Function','rbf', 'RBF_Sigma',1);
%# test using test instances
pred = svmclassify(svmModel, meas(testIdx,:), 'Showplot',false);
%# evaluate and update performance object
cp = classperf(cp, pred, testIdx);
end
%# get accuracy
cp.CorrectRate
%# get confusion matrix
%# columns:actual, rows:predicted, last-row: unclassified instances
cp.CountingMatrix
avec la sortie:
ans =
0.99333
ans =
100 1
0 49
0 0
nous avons obtenu 99.33%
précision avec un seul 'setosa' instance mal classés comme 'non-setosa'
MISE À JOUR: SVM fonctions ont été déplacées dans la boîte à outils Statistiques dans R2013a
Merci pour Le bel exemple. Un peu de confusion que j'ai. Supposons que j'ai 50 entrées en tout. Le code ci-dessus le divise en 10 séries de 5 entrées chacune, puis utilise 9 pour s'entraîner et 1 pour tester dans chaque itération. Mais le flux habituel devrait être un peu différent peut-être, c'est-à-dire 1. train 2. cross valider répéter le ci-dessus et ensuite tester? ou ça ne fait pas de différence? –
@ user488652: Je ne suis pas clair sur votre question, mais le code ci-dessus suit la méthode standard de [validation croisée n-fold] (http://en.wikipedia.org/wiki/Cross-validation_%28statistics%29 # K-fold_cross-validation) – Amro
@Amro Pouvez-vous expliquer 'groups = ismember (species, 'setosa');' Pourquoi avez-vous utilisé 'setosa' et pas deux autres types de sortie. Comment puis-je l'utiliser pour mon ensemble de données stocké dans une matrice 25X5 et aboutit à une matrice 25X1 avec deux sorties. – MaxSteel