Comment puis-je dire à NLTK de traiter le texte dans une langue particulière?peut NLTK/pyNLTK travail "par langue" (c'est-à-dire non-anglais), et comment?
De temps en temps, j'écris une routine PNL spécialisée pour faire du marquage POS, de la segmentation des jetons, etc. sur un domaine de texte non anglais (mais encore hindo-européen).
Cette question semble répondre que différents corpus, pas le changement dans le code/paramètres: POS tagging in German
Alternativement, sont là tous les modules PNL spécialisés en hébreu/espagnol/polonais pour python?
merci. le tokenizer phrase punkt semble la bonne direction. –
Comment fonctionne Treetagger? http://stackoverflow.com/questions/15503388/treetagger-installation-successful-but-cannot-open-par-file – alvas