Wenn Bilder lesbar werden: So funktioniert Texterkennung

Hannover (dpa/tmn) - Bilder von Dokumenten machen kann dank Smartphones fast jeder - und Sekunden später ist die Datei auch schon auf dem PC. Der Haken: Bearbeiten oder durchsuchen kann man einen fotografierten Text nicht.

Wenn Bilder lesbar werden: So funktioniert Texterkennung
Foto: dpa

Abhilfe schaffen Texterkennungs-Programme.

Ein Bild soll vor allem hübsch aussehen. Wird dagegen Text fotografiert, steht die Optik oft nicht an erster Stelle. Geknipste Bücherseiten, Visitenkarten oder Fahrpläne sind vor allem dann nützlich, wenn sie bearbeitet und durchsucht werden können. Damit das klappt, muss eine Bilddatei zunächst per Texterkennung oder Optical Character Recognition (OCR) in eine Textdatei umgewandelt werden.

OCR-Programme arbeiten mit einem sogenannten Mustervergleich. Denn jeder Buchstabe hat bestimmte charakteristische Merkmale - ein „a“ unterscheidet sich etwa von einem „o“ durch das kleine Beinchen rechts unten. „Deutlich besser werden die Ergebnisse, wenn das Resultat der Mustererkennung noch mit einem Wörterbuch abgeglichen wird“, sagt Dorothee Wiegand vom Computermagazin „c't“. Wenn die Vorlage etwas undeutlich ist, wird das Wort „Zeichen“ zum Beispiel möglicherweise als „Zelchen“ erkannt. Da „Zelchen“ aber nicht im Wörterbuch steht, spuckt gute Software letztlich trotzdem das korrekte Wort aus.

Selbst gute Mustererkennung stößt aber an ihre Grenzen, wenn die Schriftart besonders schnörkelig ist und wie eine Schreibschrift wirkt. „Bei der Segmentierung können außerdem einzelne Symbole getrennt werden“, erklärt Michaela Geierhos von der Universität Paderborn. Aus einem „m“ kann so schnell ein „in“ werden, aus einem „e“ ein „c“ und aus „rn“ auch mal ein „m“. Bei zu kleinen Buchstaben seien die Ergebnisse oft unbrauchbar. Voraussetzung für gute Ergebnisse ist in jedem Fall, dass der Scan oder das Foto von guter Qualität ist. Dunkelgraue Schrift auf hellgrauem Grund ist zum Beispiel tabu.

Für sehr gute Texterkennung müssen Nutzer etwas Geld investieren. „Richtig gute Software für den Privatanwender kostet in der kleinsten Ausgabe zwischen 100 und 200 Euro“, sagt Dorothee Wiegand. Die Redakteurin empfiehlt zum Beispiel OmniPage von Nuance, FineReader von Abbyy oder Readiris von Iris. Bei Gratis-Programmen muss der Nutzer zwar Abstriche machen, ganz chancenlos gegen die kostenpflichtige Konkurrenz sind sie jedoch nicht. „Sehr gute Ergebnisse für den Privatanwender liefert die kostenlose Software Tesseract, die bei manchen Betriebssystemen bereits mitgeliefert wird“, sagt Michaela Geierhos.

Tesseract wurde ursprünglich von Hewlett-Packard entworfen und von Google weiterentwickelt. Es ist Grundlage verschiedener kostenloser OCR-Programme für Windows, Mac und Linux. Eventuell geht es aber auch ganz ohne Software: Google und Microsoft haben in ihre Clouddienste Drive und OneDrive, ehemals SkyDrive, Texterkennungen eingebaut.

Der Umgang mit Texterkennungs-Apps für Smartphones ist etwas tückisch. Ob die OCR-Programme für unterwegs zuverlässig arbeiten, hängt von verschiedenen Faktoren ab. „Zum Beispiel von der Kamera des Smartphones und davon, wie sorgfältig der Anwender das Foto macht“, sagt „c't“-Redakteurin Dorothee Wiegand. Wichtig seien auch hier gute Kontraste, ein scharfes Bild und ausreichend groß aufgenommene Buchstaben.

Alles in allem hätten private Nutzer von Texterkennungs-Programmen „keine Riesenvorteile“, sagt Gernot Fink von der Technischen Universität Dortmund. Hilfreich könne die Texterkennung aber für Reisende sein, wenn sie mit einem Übersetzungsprogramm kombiniert werde. Studenten und Wissenschaftler, die viel mit fremden Texten arbeiten, können mit OCR ebenfalls Zeit sparen. Und auch bei Lesehilfen für sehbehinderte Menschen kommt die Technologie zum Einsatz.

Meistgelesen
Neueste Artikel
Zum Thema
Aus dem Ressort