Text per OCR erkennen

Erkennen Sie Text in gescannten PDFs per OCR — direkt im Browser, kostenlos und ohne Upload.

PDF-Datei hochladen

Klicken oder Datei hierher ziehen

Maximum: 25 MB, bis zu 200 Seiten

So funktioniert's

PDF hochladen

Per Klick oder Drag & Drop hochladen. Bis zu 25 MB und 200 Seiten.

Sprache wählen & OCR starten

Wählen Sie die Dokumentsprache und starten Sie die automatische Texterkennung.

Erkannten Text herunterladen

Kopieren Sie den erkannten Text oder laden Sie ihn als TXT-Datei herunter.

Häufig gestellte Fragen

Wie funktioniert die OCR-Erkennung?

Jede PDF-Seite wird als Bild gerendert und anschließend mit Tesseract.js analysiert. Die OCR-Engine erkennt Buchstaben, Wörter und Absätze und gibt den extrahierten Text zurück. Die gesamte Verarbeitung erfolgt lokal in Ihrem Browser.

Welche Sprachen werden unterstützt?

Aktuell werden Deutsch, Englisch, Französisch, Spanisch und Italienisch unterstützt. Die Sprachauswahl beeinflusst die Erkennungsgenauigkeit — wählen Sie die Sprache, in der der Großteil des Textes verfasst ist.

Werden meine Dateien auf Servern gespeichert?

Nein, niemals. Die gesamte OCR-Verarbeitung erfolgt lokal in Ihrem Browser. Ihre PDF-Dateien werden nicht hochgeladen und verlassen nie Ihren Computer. Die Sprachmodelle werden einmalig vom CDN geladen und im Browser-Cache gespeichert.

Wie genau ist die Texterkennung?

Die Genauigkeit hängt von der Qualität des gescannten Dokuments ab. Bei sauberen Scans mit gutem Kontrast erreicht Tesseract.js typischerweise 90–99 % Erkennungsgenauigkeit. Schiefe Scans, niedrige Auflösung oder ungewöhnliche Schriftarten können die Genauigkeit reduzieren.

So funktioniert's

1

PDF/Bild hochladen

Lade die eingescannte PDF oder das Bild hoch.
2

Sprache wählen

Wähle die Hauptsprache des Dokuments (Deutsch, Englisch, Spanisch, ...) für höhere Erkennungs-Qualität.
3

Erkennung starten

Klicke "OCR starten". Je nach Größe dauert die Verarbeitung 30 Sekunden bis mehrere Minuten.

Wann brauchst du das?

Eingescannte Verträge

Alte Verträge die nur als Scan vorliegen werden durchsuchbar und kopierbar.

Handschriftliche Notizen

Notizen die als Foto vorliegen, in editierbaren Text umwandeln.

Buch-Auszüge

Abfotografierte Buchseiten in Text konvertieren für Hausarbeiten oder Forschung.

Deine Daten bleiben bei dir

Alle PDFs werden direkt in deinem Browser verarbeitet, kein Upload zu unseren Servern. Wir sehen deine Dateien nie. Das ist DSGVO-konform und sicher auch für sensible Dokumente wie Verträge, Bewerbungen oder Rechnungen.

Häufige Fragen

Welche Sprachen werden unterstützt?

Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Türkisch, Arabisch, Chinesisch (vereinfacht) und mehr — über Tesseract.js.

Werden meine PDFs auf einen Server hochgeladen?

Nein. Alle Operationen passieren direkt in deinem Browser, lokal. Wir sehen deine Dateien nie. Das ist DSGVO-konform und sicher auch für sensible Dokumente wie Verträge, Bewerbungen oder Rechnungen.

Funktioniert das auch auf dem Smartphone?

Ja. Auf modernen Mobilbrowsern (Safari iOS 14+, Chrome Android) funktioniert das Tool genauso wie am Desktop, allerdings sind sehr große PDFs (>100 MB) auf älteren Geräten manchmal langsam.

Wie genau ist die Erkennung?

Bei sauberen Scans (300 DPI, gerader Winkel) typisch 95-99 % korrekt. Bei schlechten Scans, Schräglagen oder verblasstem Text deutlich weniger.

Funktioniert das mit Handschrift?

Druckschrift (auch handgemalt mit klaren Buchstaben) ja. Echte Schreibschrift wird kaum erkannt.

Text per OCR erkennen

So funktioniert's

PDF hochladen

Sprache wählen & OCR starten

Erkannten Text herunterladen

Häufig gestellte Fragen

So funktioniert's

PDF/Bild hochladen

Sprache wählen

Erkennung starten

Wann brauchst du das?

Eingescannte Verträge

Handschriftliche Notizen

Buch-Auszüge

Deine Daten bleiben bei dir

Häufige Fragen

Verwandte Tools