Lernzentrum
Erfahren Sie, wie ABBYY Technologien funktionieren und Ihnen zu höherer Produktivität verhelfen.
Unsere jüngsten Untersuchungen haben ergeben, dass PDF-Dokumente bis zu 70 % des Dokumenten-Workflows einer durchschnittlich modernen Firma ausmachen – mehr als ein Drittel dieser PDFs werden aus Scans erstellt. ABBYY Technologien ermöglichen den Zugang zu diesen Dokumenten und steigern ihren Geschäftswert, indem sie zugehörige Geschäftsprozesse in Organisationen schneller und effizienter machen.
Was ist PDF?
Das PDF ist heutzutage ein universeller und unabkömmlicher Standard für den Informationsaustausch in unserer schnelllebigen Welt. Was genau ist PDF und warum wurde es zum Standard für den Informationsaustausch in unserer digitalen Welt?
PDF-Standards
Seit Juli 2008 ist das PDF-Format, das ursprünglich von Adobe erfunden wurde, ein internationaler ISO-Standard, mit einer Reihe von untergeordneten Standards für Teilbereiche wie Archivierung, Verfügbarkeit, technische Bearbeitung und weitere. Verschiedene Anbieter arbeiten heutzutage an der Entwicklung und Bereitstellung von Software, mit der PDF-Dokumente betrachtet, bearbeitet, erstellt und geschützt werden können.
Was ist OCR?
OCR, Optical Character Recognition (Optische Zeichenerkennung), oder Texterkennung, ist eine Technologie, die die Umwandlung unterschiedlicher Dokumente, wie beispielsweise gescannter Papierdokumente, PDF-Dateien oder Digitalbilder in bearbeitbare und durchsuchbare Dateien ermöglicht.
PDF-Umwandlung
Ursprüngliche Zielsetzung des PDF-Dateiformats war, den exakt gleichen Inhalt in exakt selben Layout darstellen zu können, egal welches Betriebssystem, welche Hardware oder Softwareanwendung zur Betrachtung eingesetzt wird. Heutzutage ist es jedoch unabdingbar, dass sich PDF-Dokumente durchsuchen lassen, Inhalte aus ihnen herauskopiert oder gesamte Dokumente in voll-editierbare Formate „konvertiert“, also umgewandelt, werden. Dies ist nicht immer trivial, besonders dann, wenn PDFs durch Einscannen von Papierseiten oder aus einem Bild-Format erstellt wurden.
Arten von PDFs
PDF-Dokumente können in drei Kategorien unterteilt werden, je nachdem wie eine Datei ursprünglich erstellt wurde. Dies bestimmt auch, ob auf ihren Inhalt (Text, Bilder, Tabellen) zugegriffen werden kann, oder ob dieser in einem Bild der Dokumentenseite gebunden, also „eingeschlossen“, ist.
Digitale Signaturen in PDF-Dokumenten
Mit einer Zertifikat-Signatur kann der Unterzeichner identifiziert und die Dokumentenintegrität verifiziert werden. Sie basiert auf einem digitalen Zertifikat, das Daten über den Autor der Signatur sowie alle Änderungen im elektronischen Dokument nach der Unterzeichnung enthält.
Digitalisierung alter Dokumente: Gotik/Fraktur-OCR
ABBYY entwickelt Fraktur OCR seit 2003 und unterstützt Frakturschrift, Schwabacher und die meisten anderen gotischen Schriftarten auf Englisch, Deutsch, Französisch, Italienisch, Spanisch und Lettisch.