Étant donné un graphe sans grande échelle (un graphe de réseau social), quelle est la meilleure façon de l'échantillonner de sorte que l'échantillon conserve une abstraction acceptable des propriétés de l'original?Comment graver un graphe sans échelle
J'ai un grand graphique (jeu de données twitter de Munmun, si vous le connaissez). Mais j'ai besoin d'un échantillon connexe de ce graphe avec un diamètre raisonnablement grand (tl; dr ... raisons pour lesquelles, sur demande ... un diamètre de 10 serait bon). Le problème est que toute recherche un peu plus large est susceptible de rencontrer certains nœuds massivement connectés. Alors je commence une telle recherche, en obtenant les amis de tous les nœuds que je rencontre. Je rencontre inévitablement des noeuds massivement connectés, et je dois avoir tous leurs amis. C'est un problème parce que je me retrouve avec un grand nombre de nœuds qui sont proches les uns des autres dans le graphique. Pour rendre l'analyse programmatique réalisable, je dois limiter le nombre de nœuds (et de bords). Le but de cet exercice est de trouver les chemins les plus courts entre les nœuds, donc je m'intéresse généralement à TOUS les voisins d'un nœud. Et c'est le problème.
Un hack autour de ceci est de limiter le maximum. nombre de nœuds connectés à un utilisateur qui m'intéresse. Par exemple, si je croise @barackobama dans ma recherche approfondie, je m'assure que je n'accepte qu'une petite partie de ses amis et que j'ignore le reste. Mais ce graphique piraté en valait-il la peine, ou suis-je en train de perdre trop d'informations pour trouver les chemins les plus courts?
espoir qui fait sens ...
Merci ... l'information sur cette page est utile ... –