Quelqu'un a-t-il connaissance de liens, d'articles, de présentations ou d'articles de blog décrivant un moteur de recherche de texte intégral à grande échelle basé sur un magasin de clés/valeurs distribuées?Architecture pour le moteur de recherche basé sur la clé distribuée/magasin de valeur?
Je m'intéresse particulièrement à l'organisation de l'indice. Quelle est exactement la structure de données? Où et comment sont stockés les dictionnaires et les publications? Quel est le flux de travail pour le traitement des requêtes? Comment les requêtes sont-elles traitées de telle sorte qu'il n'est pas nécessaire de transporter des quantités massives de données sur le réseau? Je crois comprendre que Blekko est construit de cette façon. J'aimerais savoir ce qu'ils ont fait, eux ou leurs concurrents.