2010-10-07 23 views
4

J'ai un document un peu volumineux et je veux faire l'arrêt de l'élimination des mots et le bourrage sur les mots de ce document avec Python. Est-ce que quelqu'un sait un paquet d'étagère pour ceux-ci? Si ce n'est pas un code qui est assez rapide pour les documents volumineux est également la bienvenue. MerciStop-mot élimination et stemmer en python

Répondre

8

NLTK prend en charge cela.

+0

Oui, utilisez NLTK. C'est open source et fonctionne sur Windows, Mac et Linux. –

4

Si, pour une raison quelconque, vous ne souhaitez pas utiliser NLTK, vous pouvez essayer PyStemmer. Pour les mots d'arrêt il suffit de télécharger une liste (google it) et de les filtrer.