J'essaye d'analyser du texte et de le schématiser, comme vous le feriez d'une phrase. Je suis nouveau à NLTK et j'essaie de trouver quelque chose en NLTK qui m'aidera à accomplir ceci. Jusqu'à présent, j'ai vu nltk.ne_chunk
et nltk.pos_tag
. Je les trouve pas très utiles et je ne trouve pas de bonne documentation en ligne.découpage/analyse de texte en utilisant NLTK
J'ai également essayé d'utiliser le LancasterStemmer
, mais je ne comprends pas complètement ce qu'il fait ou comment il devrait être utilisé ou pourquoi il existe même.
Quelqu'un peut-il m'aider s'il vous plaît avec ceci? Je suis vraiment perdu et je me sens très frustré sans aucune lumière directrice.
Merci à l'avance
Qu'essayez-vous d'accomplir exactement? Avez-vous réellement besoin d'une analyse sémantique, ou simplement d'une analyse lexicale? Quel est le digramme que vous essayez de produire? –
En fin de compte, je veux être en mesure de créer un "arbre" qui représente les données dans le texte. Une fois cela fait, je peux faire la même chose pour un autre texte (sur le même sujet - disons une conférence) et comparer où les deux sont similaires/différents et incorporer les différences. Cela peut finalement donner un "arbre" qui a la représentation la plus précise de cette conférence – inspectorG4dget