Je prévois d'utiliser orange pour le clustering kmeans. Je suis passé par les tutoriels, mais j'ai encore quelques questions que je voudrais poser:Python KMeans Orange Framework
Je fais face à la mise en cluster sur des vecteurs de grande dimension. 1) Y a-t-il une distance cosinus mise en œuvre? 2) Je ne veux pas donner de zéros aux valeurs vides. J'ai essayé de ne pas avoir de zéros dans les champs vides et je obtenir l'erreur:
SystemError: 'orange.TabDelimExampleGenerator': the number of attribute types does not match the number of attributes
Comment puis-je indiquer une valeur vide? 3) Y a-t-il un moyen d'utiliser incorporer un "ID" dans la table d'exemple? Je veux étiqueter mes données par un ID (pas de classification) pour une référence plus facile. Je ne fais pas la colonne ID pour être ma partie officielle de mes données.
4) Existe-t-il un moyen de produire différemment pour le clustering de kmeans? je préférerais quelque chose dans ce format:
cluster1: [ <id1>, <id2>, ...]
cluster2: [ <id3>, ... ]
rather than just [1, 2, 3,1 , 2, ... ]
Merci!