2010-09-23 20 views

Répondre

0

Voulez-vous juste les jetons (mots)? Si oui, vous voulez quelque chose comme:

Reader r; // initialized somehow by you 
Tokenizer<CoreLabel> tokenizer = new PTBTokenizer<CoreLabel>(r, new CoreLabelTokenFactory(), ""); 
while (tokenizer.hasNext()) { 
    CoreLabel token = tokenizer.next(); 
    System.out.println(token); 
} 

Ou voulez-vous les phrases dans l'arbre d'analyse? Si c'est le cas, vous devriez obtenir l'arbre retourné comme dans ParserDemo dans la distribution et utiliser les expressions (sous-arbres) dans celui-ci (vous pouvez itérer sur eux:

Tree parse = lp.apply(sentence); 
for (Tree subtree : tree) { 
    System.out.println(subtree); 
}