2010-09-07 23 views
0

hay tous. peut-être que vous pouvez m'aider dans mon projet. im en utilisant pdfcreator comme une imprimante virtuelle pour imprimer dans un fichier certaines images. peut être pdf peut être n'importe quel type d'image. mais j'ai besoin d'en extraire des données. cela peut-il être fait? Im utilisant C#.traiter les données d'une image comme pdf ou autre chose en utilisant pdfcreator

+0

Veuillez spécifier avec plus de détails quel type de données vous voulez extraire. Et à partir de quel fichier voulez-vous extraire: à partir d'un PDF créé par PDFCreator? D'une image créée par PDFCreator ?? Ou...??? –

+0

Je veux extraire un texte du pdf ou de l'image. peut-être les données envoyées à l'imprimante. Je cherche un nombre dans le texte. – Guy

Répondre

0

Vous ne pouvez pas extraire du texte à partir d'images.

En principe, vous pouvez extraire du texte à partir de fichiers PDF.

Voici deux méthodes utilisant les utilitaires de ligne de commande du logiciel libre; peut-être l'un d'entre eux correspond à vos besoins:

  1. pdftotext.exe (partie de Foolabs' XPDF utilities)
  2. gswin32c.exe (Artifex » Ghostscript)

Exemple pour extraire tous les lignes de commande le texte des pages 3-7:

pdftotext:

pdftotext.exe^
    -f 3^
    -l 7^
    -epl dos^
    -layout^
    "d:\path with spaces\to\input.pdf"^
    "d:\path\to\output.txt" 

Vous souhaitez obtenir la sortie de texte sur stdout au lieu d'un fichier? OK, essayez ceci:

pdftotext.exe^
    -f 3^
    -l 7^
    -epl dos^
    -layout^
    "d:\path with spaces\to\input.pdf"^
    - 

Ghostscript: (Vérifiez que votre installation a ps2ascii.ps dans son lib sous-répertoire)

gswin32c.exe^
    -q^
    -sFONTPATH=c:/windows/fonts^
    -dNODISPLAY^
    -dSAFER^
    -dDELAYBIND^
    -dWRITESYSTEMDICT^
    -dSIMPLE^
    -f ps2ascii.ps^
    -dFirstPage=3^
    -dLastPage=7^
    "c:/path/to/input.pdf"^
    -dQUIET 

sortie de texte apparaît sur la sortie standard. Si vous testez cela dans une fenêtre cmd.exe, vous pouvez rediriger cela vers un fichier en ajoutant > /path/to/output.txt à la commande.