2010-04-26 7 views

Répondre

8

Le Stanford Parser retourne juste une liste de dépendances entre les jetons de mot. (Nous faisons cela pour éviter les dépendances de bibliothèques externes.) Mais si vous voulez manipuler les dépendances, vous voudrez certainement les mettre dans une structure de données graphique. Nous utilisons habituellement jgrapht: http://jgrapht.sourceforge.net/

+0

Merci. J'utilise en fait ceci pour extraire des triplets (Sujet, Verbe, Objet) de phrases. Mon idée était de détecter d'abord les entités dans la phrase, puis, pour chaque paire d'entités, de trouver un chemin entre elles dans le graphe de dépendance qui contenait un verbe. Le problème est que, bien que cela fonctionne pour certains cas, pour certains, ce n'est pas le cas. Comme celui-ci: "Le papier est un matériau mince et plat produit par des fibres compressées.". Ici, l'analyseur stanford trouve une relation nsubj directe entre "papier" et "matériel". Pouvez-vous recommander un bon moyen de faire cette triple extraction? Merci. – pns

+3

Dans la représentation SD, la copule (verbe "être") n'est pas traitée comme un prédicat, plutôt le nom ou l'adjectif est traité comme le prédicat: mince (papier) matériau (papier). Voir la discussion dans http://nlp.stanford.edu/pubs/dependencies-coling08.pdf (section 2.2) Mais si vous vouliez annuler cela, vous pourriez rechercher une dépendance de cop() du nom ou de l'adjectif et réécrire comme être (papier, mince) être (papier, matériel) –

+0

Salut pouvez-vous m'aider M. pns, je veux faire la même chose, mais je ne sais pas comment –