Alte europäische Sprachen und gotische Schriften
Digitalisierung alter Dokumente: Gotik/Fraktur-OCR
ABBYY entwickelt Fraktur OCR seit 2003 und unterstützt Frakturschrift, Schwabacher und die meisten anderen gotischen Schriftarten auf Englisch, Deutsch, Französisch, Italienisch, Spanisch und Lettisch.
Die Herausforderung: Digitalisierung alter Dokumente
-
Gebrochene Schriften
Gebrochene Schriften entstanden erstmals im 12. Jahrhundert und entwickelten sich im Laufe der Jahrhunderte in vielen verschiedenen Variationen weiter.
-
Frakturschrift
Die Frakturschrift, vorherrschend in Deutschland, wurde durch Kaiser Maximilian eingeführt und hat sich schnell in vielen Teilen Europas etabliert.
-
Besonderheiten
Die Besonderheiten dieser Schrift beinhalten das verlängerte „s“ und Ligaturen oder zusammenhängende Buchstaben bei bestimmten Kombinationen. Die Erscheinungshäufigkeit dieser Eigenart ist entscheidend für das Verständnis von Frakturschrift, wenn man Erkennungstechnologien für Texte, die aus der Zeit zwischen 1800 und 1938 entstanden, entwickeln möchte.
-
Digitalisierung
Mit zunehmender Digitalisierung wird auch der Informationsfluss digital. Dies führt auch zur Gründung „Digitaler Bibliotheken“. Aus diesem Grund wird es immer wichtiger, auch historische Dokumente mit Frakturschrift digital online verfügbar zu machen.
-
Scannen
Scannen ist nur der erste Schritt - Optische Zeichenerkennung (OCR) ist eine Schlüsseltechnologie, um historische Inhalte digital für Menschen, Suchtechnologien und andere Analyseverfahren zu erschließen.
Erkennung von alten europäischen Sprachen und Gotischen Schriftarten ist verfügbar in ABBYY FineReader PDF 15 und ABBYY FineReader Server.