Je cherche une bibliothèque (si possible disponible en Java ou PHP) afin d'extraire le texte d'un PDF. Il y a beaucoup de logiciels disponibles, y compris:Extraction de texte de PDF: PDFLib vs PDF extrait vs pdf2xml
3-Heights ™ PDF Extrait http://www.pdf-tools.com/pdf/pdf-extract-content-metadata-text.aspx
PDFlib TET - Text Extraction Toolkit http://www.pdflib.com/products/tet/
Quels outils choisiriez-vous? Que penses-tu d'eux?
Nous vous remercions de votre aide!