2010-12-14 10 views
0

je suis en train d'extraire des détails tels que le nom, l'adresse, etc. qualification de CV (ms) mot .....façon d'extraire les détails comme le nom, ph pas de CV (ms mot)

je sais CV sont généralement dans des formats différents .....

donc des idées peut être utile .....

merci

+0

Cette question est trop large. Quel est votre problème exact? Lire le fichier MS Word? Analyser le texte pour correspondre à différents formats? Je ne pense pas que quelqu'un puisse vous aider de cette façon. – Razzie

Répondre

0

Son plus facile de le faire avec Excel. Donc, demander des CV au format Excel si possible sinon:

Vous devez créer un objet Word (il existe un modèle pour cela dans Visual Studio 2008 et 2010) et lire le texte du document et l'analyser. Cette méthode est très sujette aux erreurs car différents utilisateurs peuvent utiliser des syntaxes différentes. Encore une fois, vous devez les forcer à adopter une syntaxe unique et nous revenons à la même position (format Excel).

0

Vous pouvez jeter un oeil à la boîte à outils Apache Tika open source qui peut extraire le texte de tous les produits Microsoft et bien plus encore.

Voici une liste de ce qu'il peut analyser: http://tika.apache.org/0.5/formats.html