Le format PDF a été initialement conçu pour afficher exactement le même contenu et la même mise en page indépendamment du système d'exploitation, de l'appareil ou de l'application logicielle dans laquelle il est visualisé. Cependant, la possibilité d’effectuer des recherches dans des PDF, d'extraire des informations ou de convertir des documents complets en formats modifiables est devenue absolument nécessaire. Ce n'est pas toujours facile, surtout si le PDF est un fichier image" créé avec un scanner. L'OCR et la technologie de conversion de fichiers PDF sont nécessaires pour rechercher, extraire et réutiliser des informations à partir de ces fichiers.

Qu'est-ce que l'OCR ?

La reconnaissance optique de caractères (OCR) ou reconnaissance de texte déverrouille les informations « piégées » dans une image numérisée / photographiée d'un document. Un logiciel OCR tel qu'ABBYY FineReader PDF « lit » le contenu d'un document (texte et structure) en interprétant les images des caractères et en leur affectant un équivalent électronique, permettant ainsi de convertir le contenu et la mise en page du document en formats interrogeables et modifiables.

La reconnaissance optique de caractères (OCR) ou reconnaissance de texte
La reconnaissance optique de caractères (OCR) ou reconnaissance de texte

Cliquez ici pour une description plus détaillée de la technologie OCR et de son fonctionnement ›

Quelques exemples de tâches de conversion courantes

Fichiers PDF en fichiers PDF et PDF/A interrogeables

  • Créer des documents PDF avec un scanner donne des fichiers PDF image uniquement , sans couche texte. La conversion de documents PDF numérisés en fichiers PDF contenant du texte sélectionnable et interrogeable permet de gérer, copier, indexer facilement le contenu et de faire de la recherche plein texte. Les organisations, en particulier dans les secteurs juridiques, éducatifs ou publics, peuvent ainsi bénéficier de l'accès rapide aux informations via des applications électroniques comme l’eDiscovery ou les systèmes de GED.
  • La conversion de documents PDF en format PDF/A permet un archivage à long terme tout en répondant aux normes de conformité pour les processus d'archivage.

Conversion de PDF en fichiers Word

  • Convertir des documents PDF en fichiers Microsoft® Word vous permet d'accéder à des informations initialement verrouillées dans un fichier PDF (p. ex. contrats, rapports, articles, etc.).
  • En convertissant un fichier PDF en un document Microsoft® Word, vous pouvez facilement modifier ou changer son contenu sans perdre de temps à le ressaisir et le remettre en page.
  • La mise en page originale est reproduite avec exactitude, y compris les images, les tableaux et les colonnes.

Conversion de PDF en fichiers Excel

  • En convertissant un document PDF en Microsoft® Excel®, les feuilles de calcul deviennent disponibles pour une modification ou un calcul ultérieur.
  • La structure originale en rangs et en colonnes est préservée, vous permettant de formater facilement et de travailler avec des données numériques issues de listes de prix, de rapports analytiques ou d'articles de presse, directement dans Excel.
  • Si seuls les tableaux contenus dans un grand document de plusieurs pages vous intéressent, il est possible d'ignorer le texte à l'extérieur des tableaux pendant le processus de conversion.

Conversion de PDF en fichiers RTF

  • La conversion de documents PDF en fichiers RTF vous permet d'éditer le texte du PDF original sur différents systèmes d'exploitation tels que Mac®, Linux® ou Windows®.
  • Une fois converti en RTF, le document peut être ouvert et utilisé dans n'importe quel logiciel de traitement de texte, qu'il s'agisse d'une version antérieure de Microsoft® Word, WordPerfect®, OpenOfficeTM Writer ou Apple® Pages.

Conversion de PDF en fichiers EPUB

La conversion de documents PDF en fichiers EPUB rend la lecture de livres ou d'articles électroniques sur un téléphone mobile ou une tablette nettement plus confortable, tout en vous permettant de modifier la taille de police et d'ajuster le flux de texte pour s'adapter à l'écran.

Conversion de PDF en fichiers HTML

La conversion de documents PDF en fichiers HTML afin de publier les informations sur le Web peut faire gagner beaucoup de temps et épargner des efforts en préservant la structure du document original.