2010-02-26 7 views
1

Étant donné un document PDF, est-il possible de générer un modèle XSL-FO (FOP)?Est-il possible de générer un modèle XSL-FO à partir d'un fichier PDF?

Évidemment, ce serait une chose ponctuelle - le modèle généré serait juste un point de départ pour créer un modèle approprié qui récupère les données appropriées. Pour moi, l'outil idéal pour ce faire serait Java et devrait être exécutable depuis la ligne de commande ou via une tâche ANT. A défaut, cela fonctionnerait sous Linux et MacOS X.

Répondre

2

Je ne connais aucun outil de ce type. Un fichier PDF sans informations de structure de document (PDF balisé) ressemble beaucoup à une page numérisée. Pas de sémantique Vous ne pouvez même pas être sûr que vous pouvez deviner les bons endroits où un paragraphe commence ou se termine. Si vous avez étiqueté PDF, vous pouvez probablement aller un peu plus loin en fonction du niveau de détail dans la structure du document. Mais je suis sûr que vous n'obtiendrez jamais un résultat satisfaisant de cette façon. IMO vous apprenez beaucoup plus rapidement XSLT et recréer le modèle de document (c'est-à-dire la feuille de style) à la main. Cela vous donne une bonne lisibilité du code, une meilleure sémantique et de meilleures opportunités pour l'affacturage des éléments communs entre les types de documents similaires.