2010-11-23 16 views
0

Existe-t-il un moyen simple et rapide d'accéder aux métadonnées "producteur" d'un fichier PDF, en utilisant Regex ou l'analyse XML, à partir d'une application PHP?Recherche du "PDF Producer" ou de l'application source d'un PDF

La technique ne doit pas nécessairement être infaillible. L'objectif est d'inviter l'utilisateur à télécharger un fichier PDF créé avec TeX.

+0

Y at-il une position connue dans le fichier - comme le premier 4k - où "/ Creator" sera, donc cela peut être fait en lisant à partir d'un descripteur de fichier? Le résultat de l'appel de file_get_contents() sur un PDF de 200Mb + ne serait pas joli. –

Répondre

0

Vous pouvez pirater la valeur en recherchant la balise de producteur ou de créateur, mais elle peut être codée plutôt qu'ascii.

0

Sur la ligne de commande, les sorties en suivant une ligne correspondant:

$ strings my.pdf | grep TeX 


Producer (pdfTeX-1.40.10) 
/Creator (TeX) 
/PTEX.Fullbanner (This is pdfTeX, Version 3.1415926-1.40.10-2.2 (TeX Live 2009) kpathsea version 5.0.0) 

Vous pourriez faire quelque chose de similaire en PHP, voir Read plain text from binary file with PHP.