2010-03-09 9 views
4

Existe-t-il un moyen de parcourir tous les termes associés à un document particulier dans un index Lucene.NET?Lucene.NET: Récupération de tous les termes utilisés dans un document particulier

Fondamentalement, je veux être en mesure de récupérer un document de l'index en fonction de son ID, puis trouver la fréquence avec laquelle chaque terme est utilisé dans ce document. Est-ce que quelqu'un sait comment faire ceci?

Je peux trouver le nombre de documents correspondant à un terme particulier, mais pas les termes contenus dans un document particulier.

Un grand merci,

Tim

Répondre

3

En Lucene Java, au moins, l'une des options lors de l'indexation d'un document stocke le vecteur de fréquence à long terme. Le terme vecteur de fréquence est simplement une liste de tous les termes dans un champ donné d'un document, et à quelle fréquence chacun de ces termes a été utilisé. Obtenir le terme vecteur de fréquence à l'exécution implique l'appel d'une méthode dans IndexReader avec l'identifiant Lucene du document en question.