Ermitteln der Seitengröße einer PDF-Datei



  • Guten Tag

    Weis zufällig jemand von euch wie man möglichst schnell an die Seitengröße einer PDF-Datei kommt?

    Ich habe schon daran gedacht den Acrobat Reader fernzusteuern, doch da dauert das Auslesen relativ lange.
    Vor allem wenn man PDF-Dateien öffnet bei denen die Seiten das Format A0 haben.

    Zweck der Übung ist herauszufinden, ob bei einer größeren Anzahl von PDF-Dateien die im Dateinamen angegebene Blattgröße mit der tatsächlichen Blattgröße übereinstimmt.

    Leider konnte ich über Google keine Informationen darüber gefunden.
    Und über den Hexeditor konnte ich auf den ersten Blick nichts finden was nach Seitengröße aussieht.

    Kann mir bitte jemand weiterhelfen?



  • Lade Dir mall ein PDF in einen Texteditor.

    Suche mal das Object wo "/Type /Page" drinsteht. Irgendwo dort findest Du
    "/MediaBox" mit der Seitengröße in 1/8tel Pt.

    Eine PDF-Doku gibt es bei Adobe.



  • Der Eintrag MediaBox hatte ich schon im Hex-Editor gefunden.

    Leider gibt es diesen nur bei ca. 1% der Dateien.
    Bei den Meisten besteht fast die gesammte Datei wie es aussieht aus einem Binär-Stream.

    Ein Beispiel:
    (Ich darf leider nicht alle Daten herausgeben.)

    %PDF-1.6
    1 0 obj
    <</Length 101445/Filter /FlateDecode>>
    stream [Hier steht eine lange Datenwurst] endstream
    
    endobj
    2 0 obj
    <</Length 219/Filter /FlateDecode/Type /ObjStm/N 4/First 21>>
    stream [Hier steht eine kurze Datenwurst] endstream
    endobj
    3 0 obj
    <</Root 6 0 R/Info 5 0 R/ID [<XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX><XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX>]/Type /XRef/Size 8/Filter /FlateDecode/DecodeParms <</Columns 5/Predictor 12>>/W [1 3 1]/Index [0 8]/Length 37>>
    stream [Hier steht eine ganz kurze Datenwurst] endstream
    endobj
    startxref
    101849
    %%EOF
    

    Ist jemand dieses Format bekannt?



  • steht alles in der PDF-Doku.

    Die Datenwurst ist codiert: /Length 219/Filter /FlateDecode
    also 219 byte gezippt. Google mal nach xpdf, ist eine Library/Toolkit
    zum Entwurstlen der Wurst. Eigentlich ist PDF ein ASCII-Format.
    Mit den Tools kann man das dekomprimieren - es wird dann lesbar.



  • Danke vielmals, du hast mir sehr geholfen.


Anmelden zum Antworten