Ceci est difficile. Il y a probablement un nom pour cela et je ne le sais pas, alors je vais décrire le problème exactement."Analyse de cluster" avec MySQL
J'ai un ensemble de données incluant un certain nombre de valeurs soumises par l'utilisateur. Je dois être en mesure de déterminer, en fonction d'une sorte de moyenne, ou mieux, d'une «proximité des données», quelle valeur est la valeur correcte. Par exemple, si j'ai reçu les trois soumissions suivantes de trois utilisateurs, 4, 10, 3, je saurais que 3 ou 4 serait la valeur «correcte» dans ce cas. Si je devais faire la moyenne, j'obtiendrais 5,6, ce qui n'est pas le résultat escompté. J'essaie de faire cela en utilisant MySQL et PHP.
tl; dr besoin de trouver une valeur à partir d'un ensemble de données basé sur "proximité" des valeurs relatives (en utilisant MySQL/PHP)
de Merci!
Je crois que le terme pour ce type d'analyse est "analyse de cluster". –
Cela semble à peu près juste. Je viens de mettre à jour le titre de ce post. –
Vous recherchez donc la ** distance de Hamming ** entre les jeux de données. Voici le modèle mathématique: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.6.7315&rep=rep1&type=pdf – stillstanding