2010-10-17 22 views
2

Je veux coloriser les mots dans un texte en fonction de leur classification (catégorie/déclinaison, etc.). J'ai un dictionnaire qui fonctionne bien, mais le problème est qu'il y a beaucoup d'ambiguïté. foedere, par exemple, peuvent être des formes du verbe "forniquer" ou du nom "traité".Coloriage de mots et analyse syntaxique

Quelles sont les stratégies générales pour résoudre ces ambiguïtés ou générer de bonnes suppositions?

Merci!

+0

Un correcteur orthographique/grammatical à part entière est la solution évidente, et comme ceux-ci ne sont pas toujours corrects (mais de plus en plus proches), je doute qu'il existe une solution unique pour vous. Vous pouvez vérifier les vérificateurs de grammaire open source pour leurs stratégies. – Wrikken

Répondre

3

La stratégie générale consiste à exécuter d'abord un part-of-speech tagger sur les données pour déterminer la catégorie de mot (nom, verbe, etc.). Cela nécessite toutefois des données (statistiques contextuelles) et des outils. This research paper peut être un point de départ.