2010-12-15 35 views
2

que je veux faire ces tâches: 1 trouver un mot en pdf 2 mettent en évidence toutes les occurrences dans ce pdf, 3-save pdf highlight_file images de ses pages.iText Recherche, mise en évidence, l'image du résultat

Comment est-ce que je peux faire ceci? Toute aide sera appréciée.

+0

Puisque les fichiers PDF sont, pour la plupart, vectoriels, pourquoi ne pas dessiner le surlignage derrière le texte comme une boîte remplie? Je veux dire, plutôt que d'exporter l'image, puis de réimporter dans la structure PDF. – amphetamachine

+0

Vous avez raison, je veux trouver les endroits du mot et mettre en évidence ces endroits.Après cela, j'ai peut-être mis en évidence PDF dans ma main, mais à la fin de la journée je veux obtenir une image de ce pdf mis en évidence à l'utilisateur (pour des raisons de sécurité) .J'aime avoir le résultat similaire à google books.Real problèmes sont les éléments 1 et 2 que je dois trouver les lieux et mettre en évidence ces endroits.Je ne sais pas comment faire cela. – ali

Répondre

1

com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy

Il vous donnera la ligne de base, l'ascension et la descente de chaque morceau de texte sur la page. C'est à vous de construire des mots et des rectangles à partir de cette information.

Pas facile, mais possible. Ensuite, il vous suffit d'appeler GhostScript ou PDFBox ou quelque chose qui peut rendre les fichiers PDF. Difficilement "la partie facile", mais c'est un problème résolu plusieurs fois.

+0

existe-t-il un code source disponible? –