2010-12-15 45 views
4

... ou les informations relatives au genre sont-elles suffisantes? Plus spécifiquement, je suis intéressé à savoir si je peux réduire le nombre de modèles chargés par le PNL de Stanford Core pour extraire des coréférences. Je ne suis pas intéressé par la reconnaissance d'entité nommée réelle.NER est-il nécessaire pour la résolution de la coréférence?

Merci

Répondre

5

Selon le document de EMNLP qui décrit le système de COREF fourni avec Stanford CoreNLP, entités nommées balises ne sont utilisées dans l'annotation COREF suivante passe: constructions précises, tête détendue correspondant, et pronoms(Raghunathan et al. 2010).

Vous pouvez spécifier les passes à utiliser avec la propriété de configuration dcoref.sievePasses. Si vous voulez de la coréférence mais que vous ne voulez pas faire de NER, vous devriez pouvoir exécuter le pipeline sans NER et spécifier que le système coref doit utiliser uniquement les passages d'annotation qui ne nécessitent pas d'étiquettes NER.

Cependant, les annotations COREF résultant prendront un coup sur recall. Ainsi, vous pourriez vouloir faire quelques expériences pour déterminer si la qualité dégradée des annotations est un problème pour tout ce que vous les utilisez pour l'aval.

1

En général, oui. D'abord, vous avez besoin d'entités nommées car elles servent de candidat antecedents, ou de cibles auxquelles les pronoms se réfèrent. De nombreux systèmes (la plupart?) Effectuent à la fois la reconnaissance d'entité et la classification de type en une seule étape. Deuxièmement, la catégorie sémantique (par exemple, personne, organisation, emplacement) des entités est importante pour construire des chaînes de coréférence précises.