Je dispose d'un grand nombre de fichiers de définition (hdf) dont j'ai besoin pour activer la recherche. Pour Java, j'utiliserais Lucene pour cela, car c'est un moteur d'indexation de fichiers et de documents. Je ne sais pas ce que serait l'équivalent python.Indexation et recherche de fichier Python
Quelqu'un peut-il recommander quelle bibliothèque je devrais utiliser pour indexer une grande collection de fichiers pour une recherche rapide? Ou est le moyen préféré de rouler le vôtre?
J'ai regardé pylucene et lupy, mais les deux projets semblent plutôt inactifs et non pris en charge, donc je ne suis pas sûr de pouvoir compter sur eux. Woosh et pylucene semblent prometteurs, mais woosh est toujours alpha donc je ne suis pas sûr que je veuille m'en fier, et j'ai de la difficulté à compiler du pylucène, et il n'y a pas de version réelle. Après avoir regardé un peu plus les données, ce sont surtout des nombres et des chaînes de caractères par défaut, alors maintenant, un moteur d'indexation ne m'aidera pas. Espérons que ces bibliothèques se stabiliseront et que plus tard les visiteurs trouveront quelque utilité pour eux.
Je peux très bien lire les fichiers hdf5 en utilisant pytables, j'ai juste besoin de trouver le bon outil pour indexer les informations que j'en extrait. – Staale
J'ai peu d'expérience dans le domaine. Puisque vous pouvez déjà lire les fichiers hd5, je pense que pyIndexer pourrait fonctionner pour vous. J'ai peu d'expérience dans le domaine et j'espère que votre projet fonctionne bien. – batbrat