J'ai un document un peu volumineux et je veux faire l'arrêt de l'élimination des mots et le bourrage sur les mots de ce document avec Python. Est-ce que quelqu'un sait un paquet d'étagère pour ceux-ci? Si ce n'est pas un code qui est assez rapide pour les documents volumineux est également la bienvenue. MerciStop-mot élimination et stemmer en python
4
A
Répondre
8
NLTK prend en charge cela.
4
Si, pour une raison quelconque, vous ne souhaitez pas utiliser NLTK, vous pouvez essayer PyStemmer. Pour les mots d'arrêt il suffit de télécharger une liste (google it) et de les filtrer.
Oui, utilisez NLTK. C'est open source et fonctionne sur Windows, Mac et Linux. –