2010-04-10 9 views
1

J'ai essayé d'utiliser un stemmer mais les mots qu'il produit ne sont pas à la hauteur. Il pourrait être génial si vous pouviez me faire savoir tout script lemmatizer existe pour ruby ​​ou un gem lemmatizer ou une requête SQL qui regroupe le lemme d'un mot dans la base de données wordnet. À la votre!Utilisation d'un lemmatizer en ruby ​​

Répondre

0

Ce qui suit est un Porter Stemmer, devrait se comporter comme prévu: http://stemmer.rubyforge.org/wiki/wiki.pl?HomePage

avec gem install stemmer Installer.

Alternativement, vous pouvez essayer http://github.com/aurelian/ruby-stemmer - cela a également des liens vers des gemmes supplémentaires à essayer.

+1

Découlant est différent de lemmatizing. La racine prendra un mot et produira un mot racine dépourvu de contexte, si paresseuse et paresseuse résultera en lazi ... mais avec la lemmatisation elle prend en compte le contexte et produit un mot réel (habituellement) donc dans le cas ci-dessus paresseux et paresseux serait lemmatisé à paresseux Vous pouvez vérifier la différence en utilisant cet outil http://morphadorner.northwestern.edu/morphadorner/lemmatizer/example/ – concept47