On suppose un groupe de points de données, comme un tracé ici (ce graphique n'est pas spécifique à mon problème, mais juste utilisé comme exemple approprié):détection Groupe ensembles de données
Inspection le graphique de dispersion visuellement, il est assez évident que les points de données forment deux «groupes», avec des points aléatoires qui n'appartiennent évidemment pas à l'un ou l'autre.
Je suis à la recherche d'un algorithme, qui me permettrait de:
- départ avec un ensemble de données de deux dimensions ou plus.
- détecter de tels groupes de l'ensemble de données sans connaissance préalable sur le nombre (ou le cas échéant) est peut-être une fois ont été détectés les groupes, il
- , « demander » le modèle des groupes, si un nouveau point d'échantillonnage semble correspondre à l'un des groupes