Comment analyser un fichier PDF et écrire le contenu dans un fichier Word en utilisant Java?Parse Pdf Fichier et écrire le contenu dans un fichier texte en utilisant java
Répondre
Pour l'analyse d'un fichier PDF en Java, vous pouvez utiliser Apache PDFBox: http://incubator.apache.org/pdfbox/
Pour la lecture/mot écrit (ou tout autre bureau) formats de fichiers en Java, essayez POI: http://poi.apache.org/
Les deux sont gratuits.
Vous pourriez vouloir essayer un de ces:
Une fois que vous lisez le contenu du fichier PDF, vous pouvez aussi bien les stocker dans un ODT fichier ou un fichier texte. Pour le fichier ODT, essayez http://odftoolkit.openoffice.org.
Meilleur!
Essayez la bibliothèque iText java:
iText est une bibliothèque idéale pour les développeurs qui cherchent à améliorer les applications et autres avec web locaux génération de documents PDF dynamique et/ou manipulation.
Il peut être utilisé pour votre étape d'analyse. En ce qui concerne la génération de documents Word - le OpenOffice Java API pourrait être capable de générer des documents compatibles Word (aucune expérience personnelle avec cette API).
Vous pouvez utiliser iText si le PDF source est principalement du texte. Les images et autres sont assez difficiles à manipuler lors de l'analyse. Si c'est du texte seulement, c'est aussi simple que 10 lignes de code. Voir le manuel d'iText pour des exemples.
Pour l'écriture de fichiers Word, il n'y a que des points d'accès Apache. Il peut être un peu difficile à comprendre, mais pour une tâche aussi simple, il ne devrait pas y avoir de problème.
Vous pouvez également utiliser docx4j pour écrire le docx. Comme POI, c'est gratuit. – JasonPlutext