Je suis à la recherche d'une bibliothèque Python très rapide et légère pour lire les métadonnées PDF. Je n'ai pas besoin de capacités d'écriture. Il serait préférable que seules les informations de métadonnées soient chargées, pas le fichier entier.Lecteur de métadonnées Fast Python PDF
Je réalise qu'un langage interprété comme Python n'est pas le meilleur choix pour la vitesse, mais comme cette solution doit être multiplateforme et fonctionner avec une application Python existante, il ne semble pas y avoir beaucoup de choix. J'ai extrait pyPdf et quelques autres bibliothèques, mais je recherche idéalement quelque chose de plus léger et plus rapide, adapté pour traiter des dizaines de milliers de fichiers en une seule fois.
Merci.
Qu'est-ce qui, si quelque chose, rend pyPdf trop lourd? Si vous avez seulement besoin d'écrire, ne pas importer PdfWriter. – bdd
Le lib lui-même est plutôt léger, mais il lit le fichier entier. Cela signifie que le traitement de PDF plus volumineux prend plus de temps, dans le cas de fichiers volumineux comme les manuels, il est très lent. –