2010-06-18 13 views

Répondre

6

Eh bien, la première offre une Tokenizer, la seconde fournit une Filter ;-)

Puisque vous ne pouvez avoir qu'un seul Tokenizer, EdgeNGramTokenizerFactory est utile uniquement pour les champs contenant un seul mot. Si vous souhaitez séparer la chaîne que vous fournissez pour vos documents en mots, vous devez d'abord utiliser un Tokenizer différent, qui se divise en espaces ou quelque chose, et EdgeNGramFilterFactory par la suite.