J'ai un fichier PDF numérisé, j'ai besoin d'un code source VB.net qui convertit ce fichier PDF numérisé au format texte.Convertir PDF en fichier texte en utilisant VB.net
0
A
Répondre
2
Il est fort probable que le fichier numérisé ne contienne pas le texte mais une image, vous devez donc regarder un outil OCR pour extraire le texte.
Il existe plusieurs bibliothèques OCR là comme
0
Jetez un oeil à http://snipt.org/lOgh/ - il est en C# (devrait être relativement facile de réécrire en VB.NET) et utilisations une solution OCR hébergée accessible via une API
Tesseract fonctionne parfaitement avec Bitmaps – John