Direkt zum Inhalt
Kontakt
Teilen

Kontakt

Sie haben Fragen, Wünsche oder Anregungen?
Kontaktieren Sie uns, wir helfen Ihnen gerne weiter.

News 28.11.2018

Deep Learning: Intelligente Software meistert Zeichenerkennung in allen Branchen

Medizin, Medienarchive, Automotive – Fraunhofer IAIS entwickelt OCR mit menschenähnlicher Genauigkeit

Eine Vielzahl von Texten und Informationen wird heute digitalisiert und maschinell erfasst. Dennoch gelingt es den wenigsten Programmen, Dokumente fehlerfrei zu erkennen und die Lesefähigkeit des Menschen zu erreichen. Besonders alte und schwer erkennbare Texte sind große Herausforderungen; diesen stellt sich das Fraunhofer IAIS im Rahmen des Projekts „DeepER – Deep Learning Based Optical Character Recognition“. In Zusammenarbeit mit der CIB software GmbH hat das Fraunhofer-Team eine Künstliche Intelligenz entwickelt, die Zeichen mit menschenähnlicher Genauigkeit erkennt.

„Eine Vielzahl der kommerziellen Engines ist offenbar primär auf gute Materialien ausgelegt. Hier liegt die Trefferquote bei nahezu perfekten 99 Prozent. Sobald die Qualität des Dokuments abnimmt, verringert sich die Erkennungsrate jedoch dramatisch“, sagt Iuliu Konya, Projektleiter am Fraunhofer IAIS. „Deshalb haben wir uns insbesondere auf schwer erkennbare Dokumente konzentriert und so auf unserer Fraunhofer-Expertise im Maschinellen Lernen aufbauend eine schnelle und robuste Allzweck-OCR-Engine mit menschenähnlicher Genauigkeit geschaffen – auch bei schwierigen Scans.«

Diese basiert auf Technologien des Deep Learning. In einem Projektzeitraum von 27 Monaten haben die Wissenschaftler die OCR-Engine trainiert: Historische und neue Texte, verschiedene Graustufen – dort wo es an Trainingsdaten mangelte, erzeugten die Forscher zudem selbst synthetische Texte. Der Datensatz umfasste mehr als 2.000 verschiedene Schriftarten sowie eigens erzeugte, schwer erkennbare Zeichen. Dabei wurde jedes Zeichen mindestens 5.000-mal in verschiedenen Variationen zum Training der Netze verwendet.

Nachdem die Software zunächst anhand einzelner annotierter Zeichen trainiert wurde, ist sie jetzt dazu in der Lage, innerhalb ganzer Zeilen selbstständig die jeweiligen Buchstaben und Satzzeichen zu erkennen. Und neben gut lesbaren Materialien können auch alte Schriften, Fotos mit mangelhafter Belichtung und schlecht erhaltene Dokumente entziffert werden. Selbst Hinweisschilder auf Baustellen oder Plakattexte erkennt die Software, was ihren Einsatz über die klassische Dokumentenanalyse hinaus ermöglicht, etwa beim Autonomen Fahren oder für die Hilfe Sehbehinderter, denen künftig Texte in ihrer Umgebung vorgelesen werden könnten.

Der Projektpartner CIB software GmbH trainierte die neuronalen Netze eigenständig weiter und stellt sie im Web frei zur Verfügung. Nutzer können ab sofort ihre Dokumente auf einer Plattform hochladen und in durchsuchbare PDFs umwandeln lassen. Darüber hinaus haben sie die Möglichkeit, zum Training der Engine beizutragen, indem sie die Analyse-Ergebnisse der Engine für den eigenen Zweck optimieren.

Einen funktionsfähigen Test finden Sie hier.

Bleiben Sie informiert über die Vielfalt der digitalen Transformation in NRW.

Jetzt Wissensvorsprung sichern