PDF-Zentrale

Grundlagen · 8 Min. Lesezeit

Was ist PDF? Format, Versionen und PDF/A erklärt

PDF ist seit über 30 Jahren das Standardformat für Dokumente, die überall gleich aussehen sollen. Hinter den drei Buchstaben steckt aber kein einzelnes Format, sondern eine Familie von Standards mit ganz unterschiedlichen Zielen.

Was PDF eigentlich ist

PDF steht für Portable Document Format. Adobe hat es 1993 vorgestellt, mit dem Ziel: ein Dokument soll auf jedem Computer, jedem Drucker und jedem Bildschirm exakt gleich aussehen. Das war zu Zeiten von Windows 3.1, Mac System 7 und unzähligen inkompatiblen Druckersprachen ein Versprechen mit Gewicht. Heute selbstverständlich, damals revolutionär.

Technisch ist eine PDF-Datei ein Container. Sie kann Text, Bilder, Vektor-Grafiken, eingebettete Schriften, Formularfelder, Anmerkungen, Hyperlinks, Multimedia-Inhalte und sogar JavaScript enthalten. Was sie aber nicht ist: ein bearbeitbares Dokument im Sinne von Word. PDF ist als Endformat gedacht, nicht als Arbeitsformat.

2008 hat Adobe die Format-Spezifikation an die ISO übergeben. Seitdem ist PDF 1.7 als ISO 32000-1 ein offener internationaler Standard, jeder Hersteller darf PDFs erzeugen oder lesen ohne Lizenzgebühren an Adobe.

PDF-Versionen im Überblick

Die Versionsgeschichte ist relativ überschaubar. Die wichtigsten Sprünge:

  • PDF 1.0 (1993) — Adobe-Erstversion. Heute praktisch verschwunden.
  • PDF 1.4 (2001) — Lange der kleinste gemeinsame Nenner für Druckereien. Transparenz-Effekte erstmals möglich.
  • PDF 1.5 (2003) — Komprimierung und Object Streams. Deutlich kleinere Dateien.
  • PDF 1.7 (2006/2008 ISO) — Heute Standard. Tagged PDFs, 256-Bit-Verschlüsselung.
  • PDF 2.0 (2017) — Bessere Geo-Daten, modernere Verschlüsselung, Tagged-PDF-Erweiterungen für Barrierefreiheit.

In der Praxis erstellen Word, LibreOffice, Browser-Druck und die meisten Tools PDF 1.4 bis PDF 1.7. PDF 2.0 ist noch selten, weil ältere PDF-Reader es teils nicht vollständig verstehen. Wenn du nichts explizit auswählst, bekommst du heute meist PDF 1.7.

PDF/A: Das Format für die Ewigkeit

PDF/A ist eine spezielle Untermenge von PDF, optimiert für Langzeit-Archivierung. Definiert in ISO 19005, mit aktuell drei Hauptvarianten:

  • PDF/A-1 (2005) — Basis-Variante, alle externen Abhängigkeiten verboten
  • PDF/A-2 (2011) — Erlaubt JPEG2000, Transparenz, optionale Inhalte
  • PDF/A-3 (2012) — Erlaubt eingebettete Dateien (z.B. die Original-Word-Datei zur PDF)

Die Kernregeln: Alle verwendeten Schriften müssen in der PDF eingebettet sein. Externe Verweise (Hyperlinks zu Webseiten, JavaScript, Multimedia) sind nicht erlaubt. Ziel: Das Dokument muss in 30 Jahren immer noch genauso aussehen, auch wenn die Original-Schriften vom Betriebssystem verschwunden sind oder die verlinkte Webseite nicht mehr existiert.

Wer ist Pflicht-Nutzer? Behörden, Gerichte, Archive. Im Geschäftskontext PDF/A oft bei Verträgen, Rechnungen (für die GoBD-Aufbewahrung), Patenten, Bauplänen. Wer einmal versucht hat, eine 1995er Word-Datei zu öffnen, weiß warum: Word-Dateiformate ändern sich, PDF/A nicht.

PDF/X: Druckvorstufe

PDF/X (ISO 15930) ist für Druckereien optimiert. Alle Farben müssen als CMYK definiert sein, alle Schriften eingebettet, Schnittmarken vorhanden, Auflösung mindestens 300 DPI. Wenn du einen Flyer drucken lässt und der Drucker "PDF/X-3" verlangt, weiß du jetzt warum: er will keine Überraschungen beim Druck.

Im Alltag begegnet das den meisten kaum. Tools wie Adobe InDesign exportieren auf Knopfdruck PDF/X-3 oder PDF/X-4, wenn man "Druckvorstufe" als Preset wählt. Für Web, E-Mail oder normale Office-Dokumente ist PDF/X overkill und unnötig.

PDF/UA: Barrierefreiheit

PDF/UA (Universal Accessibility, ISO 14289) ist die jüngste relevante Variante. Sie verpflichtet zu Tagged Structure: Überschriften müssen als H1, H2 etc. gekennzeichnet sein, Tabellen müssen Zellen-Bezüge haben, alternativtexte für Bilder sind Pflicht. Damit können Screen-Reader und Vergrößerungs-Tools strukturiert durch das Dokument navigieren.

Für öffentliche Stellen ist PDF/UA in Deutschland seit 2019 (BITV 2.0) faktisch Pflicht für neue Dokumente. Im Privatsektor noch selten, aber wer Inklusion ernst nimmt oder international gegenüber großen Konzernen kommuniziert, sollte es kennen.

Welches Format wann?

Praktische Faustregeln:

  • Standard-Dokumente, E-Mail, Web: PDF 1.7. Macht jeder Browser, jedes Tool, jeder Reader.
  • Behörden-Einreichung, Vertrag-Archivierung, Gerichtsakte: PDF/A. Frag im Zweifel nach welcher Variante (A-1, A-2, A-3).
  • Druckerei-Auftrag: PDF/X. Drucker sagt welche Variante er will.
  • Behörden-Pflicht für Barrierefreiheit: PDF/UA. Erstellung erfordert Spezial-Software.

Wenn du auf pdf-zentrale.de ein PDF erzeugst (z.B. mit Word zu PDF oder JPG zu PDF), bekommst du PDF 1.7 — das richtige für 95 Prozent der Use-Cases.

Was viele über PDF nicht wissen

PDFs können JavaScript ausführen. Acrobat-PDFs konnten in den 2000ern komplette Formular-Validierungen, Datenbankabfragen, ja sogar simple Spiele in sich tragen. Heute aus Sicherheitsgründen in den meisten Readern standardmäßig deaktiviert — Adobe Acrobat warnt explizit, Browser ignorieren es ganz.

PDFs können eingebettete Dateien enthalten. Eine PDF/A-3 darf z.B. die Original-Excel-Datei mitführen. Manche E-Rechnungs-Standards (ZUGFeRD in Deutschland) basieren genau darauf: Das PDF zeigt die menschenlesbare Rechnung, intern liegt die maschinenlesbare XML mit den Buchungsdaten dabei.

PDFs sind nicht zwingend verlustfrei. Wer ein Foto in eine PDF einbettet, kann den JPEG-Komprimierer einstellen. Bei "hoher Komprimierung" verliert das Bild Details, die später nicht mehr wiederherstellbar sind.

PDFs enthalten Metadaten. Wer war der Autor? Welches Programm hat das PDF erstellt? Wann wurde es zuletzt geändert? All das steht standardmäßig drin und kann verraten, wer das Dokument bearbeitet hat. Wenn du anonym bleiben willst, lohnt sich der Blick in die Datei-Eigenschaften und das gezielte Entfernen.

Häufige Fragen zum PDF-Format

Welche PDF-Version sollte ich heute nutzen?

Für Standard-Dokumente PDF 1.7 (ISO 32000-1, seit 2008 Standard, von allen aktuellen PDF-Readern unterstützt). Für Langzeit-Archivierung PDF/A. Für Druckvorstufen PDF/X. Wer nichts Besonderes will, ist mit PDF 1.7 immer richtig.

Was ist PDF/A genau?

PDF/A (ISO 19005) ist ein Standard für Langzeit-Archivierung. Eingebettete Schriften sind Pflicht, externe Verweise und Multimedia-Inhalte sind verboten. Ziel: Das PDF muss in 30 Jahren noch genauso aussehen wie heute. Behörden und Gerichte verlangen oft PDF/A für eingereichte Dokumente.

Was ist der Unterschied zwischen PDF 1.4 und PDF 2.0?

PDF 1.4 (2001) war lange der kleinste gemeinsame Nenner für Druckereien. PDF 2.0 (ISO 32000-2, 2017) brachte Verbesserungen bei Verschlüsselung, Geo-Daten und Tagged-PDF für Barrierefreiheit. Praktisch nutzen die meisten Tools heute PDF 1.7 als Default, weil PDF 2.0 noch nicht überall unterstützt wird.

Sind PDFs editierbar?

Per Design schwer. PDF wurde 1993 von Adobe als "endgültiges" Austauschformat entworfen, im Gegensatz zu Word das auf Bearbeitung ausgelegt ist. Mit Spezial-Tools (Adobe Acrobat Pro, ähnliche) lässt sich Text und Bild verändern, aber die Mühe ist deutlich höher als in Word.

Was sind Tagged PDFs?

Tagged PDFs enthalten eine logische Struktur (Überschriften, Absätze, Tabellen, Listen) zusätzlich zur visuellen Darstellung. Wichtig für Screen-Reader und Barrierefreiheit. PDF/UA (Universal Accessibility, ISO 14289) baut darauf auf.

Warum sind manche PDFs so groß?

Hauptursache: eingescannte Bilder mit hoher Auflösung. Eine 10-MB-PDF mit Fotos lässt sich oft auf 2-3 MB reduzieren. Sekundär: eingebettete Schriften, doppelte Daten von früheren Bearbeitungen, ungenutzte Objekte. Komprimieren oder Optimieren senkt die Dateigröße deutlich.

Quellen

  • Adobe PDF Reference 1.7 (2006), Grundlage von ISO 32000-1
  • ISO 32000-1:2008 — Document management — Portable document format — Part 1: PDF 1.7
  • ISO 32000-2:2020 — Part 2: PDF 2.0
  • ISO 19005-1:2005 (PDF/A-1), 19005-2:2011 (PDF/A-2), 19005-3:2012 (PDF/A-3)
  • ISO 14289-1:2014 — PDF/UA Universal Accessibility
  • BITV 2.0 (Barrierefreie Informationstechnik-Verordnung), 2019