C'est la question:Optimisation de l'indexation par lots Lucene
J'utilise Lucene.Net et Im Importer comme ~ 255k documents avec ~ 6 champs chacun. J'ai essayé quelques choses, mais le processus prend beaucoup (~ 1 jour). Im n'utilisant aucun analyseur étrange, juste l'analizer standard et Im tokenizing seulement l'un des champs. J'ai essayé de changer les documents de fusion max et rien.
Est-ce que quelqu'un a rencontré ce problème?
Merci et meilleures salutations
Je vois tous vos points et vous avez fait des observations justes dans chacun d'eux. Pouvez-vous m'en dire plus sur les profileurs pour Lucene? Im intéressé par cela –
J'ai légèrement modifié ma réponse pour donner un lien vers le site de l'outil que je connais le plus: c'est très bien. –