J'ai essayé d'utiliser un stemmer mais les mots qu'il produit ne sont pas à la hauteur. Il pourrait être génial si vous pouviez me faire savoir tout script lemmatizer existe pour ruby ou un gem lemmatizer ou une requête SQL qui regroupe le lemme d'un mot dans la base de données wordnet. À la votre!Utilisation d'un lemmatizer en ruby
1
A
Répondre
0
Ce qui suit est un Porter Stemmer, devrait se comporter comme prévu: http://stemmer.rubyforge.org/wiki/wiki.pl?HomePage
avec gem install stemmer
Installer.
Alternativement, vous pouvez essayer http://github.com/aurelian/ruby-stemmer - cela a également des liens vers des gemmes supplémentaires à essayer.
1
Voici une gemme de lemmatizer. Devrait faire ce que vous avez besoin:
Découlant est différent de lemmatizing. La racine prendra un mot et produira un mot racine dépourvu de contexte, si paresseuse et paresseuse résultera en lazi ... mais avec la lemmatisation elle prend en compte le contexte et produit un mot réel (habituellement) donc dans le cas ci-dessus paresseux et paresseux serait lemmatisé à paresseux Vous pouvez vérifier la différence en utilisant cet outil http://morphadorner.northwestern.edu/morphadorner/lemmatizer/example/ – concept47