Text per OCR erkennen
Erkennen Sie Text in gescannten PDFs per OCR — direkt im Browser, kostenlos und ohne Upload.
PDF-Datei hochladen
Klicken oder Datei hierher ziehen
Maximum: 25 MB, bis zu 200 Seiten
So funktioniert's
PDF hochladen
Per Klick oder Drag & Drop hochladen. Bis zu 25 MB und 200 Seiten.
Sprache wählen & OCR starten
Wählen Sie die Dokumentsprache und starten Sie die automatische Texterkennung.
Erkannten Text herunterladen
Kopieren Sie den erkannten Text oder laden Sie ihn als TXT-Datei herunter.
Häufig gestellte Fragen
Wie funktioniert die OCR-Erkennung?
Jede PDF-Seite wird als Bild gerendert und anschließend mit Tesseract.js analysiert. Die OCR-Engine erkennt Buchstaben, Wörter und Absätze und gibt den extrahierten Text zurück. Die gesamte Verarbeitung erfolgt lokal in Ihrem Browser.
Welche Sprachen werden unterstützt?
Aktuell werden Deutsch, Englisch, Französisch, Spanisch und Italienisch unterstützt. Die Sprachauswahl beeinflusst die Erkennungsgenauigkeit — wählen Sie die Sprache, in der der Großteil des Textes verfasst ist.
Werden meine Dateien auf Servern gespeichert?
Nein, niemals. Die gesamte OCR-Verarbeitung erfolgt lokal in Ihrem Browser. Ihre PDF-Dateien werden nicht hochgeladen und verlassen nie Ihren Computer. Die Sprachmodelle werden einmalig vom CDN geladen und im Browser-Cache gespeichert.
Wie genau ist die Texterkennung?
Die Genauigkeit hängt von der Qualität des gescannten Dokuments ab. Bei sauberen Scans mit gutem Kontrast erreicht Tesseract.js typischerweise 90–99 % Erkennungsgenauigkeit. Schiefe Scans, niedrige Auflösung oder ungewöhnliche Schriftarten können die Genauigkeit reduzieren.
So funktioniert's
- 1
PDF/Bild hochladen
Lade die eingescannte PDF oder das Bild hoch.
- 2
Sprache wählen
Wähle die Hauptsprache des Dokuments (Deutsch, Englisch, Spanisch, ...) für höhere Erkennungs-Qualität.
- 3
Erkennung starten
Klicke "OCR starten". Je nach Größe dauert die Verarbeitung 30 Sekunden bis mehrere Minuten.
Wann brauchst du das?
Eingescannte Verträge
Alte Verträge die nur als Scan vorliegen werden durchsuchbar und kopierbar.
Handschriftliche Notizen
Notizen die als Foto vorliegen, in editierbaren Text umwandeln.
Buch-Auszüge
Abfotografierte Buchseiten in Text konvertieren für Hausarbeiten oder Forschung.
Deine Daten bleiben bei dir
Alle PDFs werden direkt in deinem Browser verarbeitet, kein Upload zu unseren Servern. Wir sehen deine Dateien nie. Das ist DSGVO-konform und sicher auch für sensible Dokumente wie Verträge, Bewerbungen oder Rechnungen.
Häufige Fragen
Welche Sprachen werden unterstützt?
Deutsch, Englisch, Französisch, Spanisch, Italienisch, Niederländisch, Polnisch, Portugiesisch, Russisch, Türkisch, Arabisch, Chinesisch (vereinfacht) und mehr — über Tesseract.js.
Werden meine PDFs auf einen Server hochgeladen?
Nein. Alle Operationen passieren direkt in deinem Browser, lokal. Wir sehen deine Dateien nie. Das ist DSGVO-konform und sicher auch für sensible Dokumente wie Verträge, Bewerbungen oder Rechnungen.
Funktioniert das auch auf dem Smartphone?
Ja. Auf modernen Mobilbrowsern (Safari iOS 14+, Chrome Android) funktioniert das Tool genauso wie am Desktop, allerdings sind sehr große PDFs (>100 MB) auf älteren Geräten manchmal langsam.
Wie genau ist die Erkennung?
Bei sauberen Scans (300 DPI, gerader Winkel) typisch 95-99 % korrekt. Bei schlechten Scans, Schräglagen oder verblasstem Text deutlich weniger.
Funktioniert das mit Handschrift?
Druckschrift (auch handgemalt mit klaren Buchstaben) ja. Echte Schreibschrift wird kaum erkannt.