Je veux analyser le fichier pdf de telle sorte que je puisse identifier le titre de chaque article et sa description. Ainsi je peux stocker le texte et le descriptiontext de titre dans le cache pour la recherche. Y at-il n'importe quelle bibliothèque ou outil?dot net: je dois analyser le fichier pdf pour obtenir chaque article avec son titre?
0
A
Répondre
1
D'abord vous pouvez installer Adobe Pdf IFilter dll. Ensuite, vous pouvez lire les propriétés de n'importe quel fichier .pdf en utilisant this library (en utilisant IFilter en C#). Ou vous pouvez également regarder dans this library (Implémentation d'un TextReader pour extraire divers contenus de fichiers en utilisant IFilter).