2010-11-22 22 views
4

S'il vous plaît suggérer un bon classificateur d'apprentissage automatique pour truecasing de données. Aussi, est-il possible de spécifier des règles propres/fonctionnalités pour truecasing dans un tel classificateur? Merci pour toutes vos suggestions.traitement du langage naturel - classificateur Truecaser

Merci

Répondre

3

I mis en œuvre une version d'un truecaser en Python. Il peut être entraîné pour n'importe quelle langue lorsque vous fournissez suffisamment de données (c'est-à-dire des phrases correctement encapsulées).

Pour l'anglais, il permet d'obtenir une précision de 98,38% sur les exemples de phrases de Wikipedia. Un modèle pré-formé pour l'anglais est fourni.

Vous pouvez le trouver ici: https://github.com/nreimers/truecaser

+0

Liens vers des ressources externes sont encouragés, mais s'il vous plaît ajouter du contexte autour du lien afin que vos collègues utilisateurs auront une idée de ce qu'il est et pourquoi il est là. Toujours citer la partie la plus pertinente d'un lien important, dans le cas où le site cible est inaccessible ou va définitivement hors ligne. De [Comment répondre] (http://stackoverflow.com/help/how-to-answer). –