Je travaille sur la construction d'un corpus Question Classification/Réponse dans le cadre de ma thèse de maîtrise. Je cherche à évaluer ma taxonomie de type de réponse attendue en ce qui concerne l'accord inter-évaluateur/la fiabilité, et je me demandais: Est-ce que quelqu'un connaît des API Java décentes (de préférence gratuites) qui peuvent le faire?Accord inter-évaluateur (API de Fleiss 'Kappa, Alpha de Krippendorff etc.)?
Je suis raisonnablement certain que tout ce dont j'ai besoin est l'Alpha de Fleiss et l'Alpha de Krippendorff à ce stade.
Weka fournit une statistique kappa dans son paquet d'évaluation, mais je pense qu'il ne peut évaluer qu'un classificateur et je n'en suis pas encore là (parce que je construis toujours le jeu de données et les classes).
Merci.
Si vous en avez encore besoin, voici quelques implémentations de Kappa de Fleiss en plusieurs langues: http://en.wikibooks.org/wiki/Algorithm_Implementation/Statistics/Fleiss'_kappa – Alex