Conversión de PDF
En sus orígenes, el formato PDF fue concebido para ver exactamente el mismo contenido y diseño con independencia del sistema operativo, dispositivo o aplicación informática desde el que se visualizara. Sin embargo, hoy en día poder realizar búsquedas en un documento PDF, extraer información del mismo o convertir documentos enteros en formato editable se ha convertido en una necesidad. No siempre es fácil, sobre todo cuando se trata de PDF que se han creado a partir de un escaneado, llamados PDF escaneados (o «PDF de solo imagen»). Las herramientas para la conversión de PDF deben incorporar tecnología OCR que permita buscar, extraer y reutilizar la información.
¿Qué es el OCR?
El reconocimiento óptico de caracteres (OCR) o reconocimiento de texto desbloquea la información «atrapada» en la imagen escaneada o fotografiada de un documento. El software OCR como ABBYY FineReader PDF «lee» el contenido de un documento (texto y estructura) interpretando las imágenes de los caracteres y asignándoles un equivalente electrónico. Así se puede transferir el contenido y diseño del documento a formatos editablesy que permiten búsquedas.
Haz clic aquí para una descripción más detallada de qué es el OCR y cómo funciona
Algunos ejemplos de tareas de conversión típicas
De formato PDF a PDF con capacidad de búsqueda y PDF/A
- Cuando se escanean documentos para crear PDF, el resultado es un PDF de solo imagen sin capa de texto. Convertir documentos PDF escaneados en documentos PDF que contengan texto que se puede seleccionar y buscar permite gestionar, copiar e indexar fácilmente su contenido, así como realizar búsquedas de texto completo. Esto permite a las organizaciones, en especial a aquellas que pertenecen a los sectores jurídico, educativo o público, beneficiarse de acceder rápidamente a la información a través de aplicaciones electrónicas como eDiscovery o sistemas de gestión de documentos.
- Además, convertir documentos PDF a formato PDF/A también permite almacenarlos a largo plazo y al mismo tiempo satisface las normas de conformidad más recientes relativas a los procesos de archivado.
De PDF a Word
- Convertir documentos PDF a Microsoft® Word® le permite acceder a la información bloqueada en el archivo PDF (p. ej., contratos, informes, artículos, etc.).
- Convirtiendo un archivo PDF a un documento Microsoft Word podrá editar o cambiar fácilmente su contenido sin perder tiempo en reescribir y reformatear.
- Y además reproducirá de forma exacta el diseño original del documento, incluyendo las imágenes, las tablas y las columnas.
De PDF a Excel
- Al convertir un documento PDF a Microsoft Excel®, en las hojas de cálculo pueden seguir realizándose ediciones o cálculos.
- La estructura original de filas y columnas se mantendrá, lo cual le permitirá formatear y trabajar con facilidad, y procesar los datos numéricos de listas de precios, informes de análisis o artículos de periódico directamente en Excel.
- Y si lo único que le interesa son las tablas que contiene un documento de varias páginas, durante el proceso de conversión puede ignorarse el texto que esté fuera de las tablas.
De PDF a RTF
- Convertir un archivo PDF en un formato RTF le permite editar el texto del PDF original en diferentes sistemas operativos, como Mac®, Linux® o Windows®.
- Una vez convertido a RTF, el documento puede abrirse y utilizarse con cualquier software de procesamiento de textos, incluso aunque se trate de una versión antigua de Microsoft Word, WordPerfect®, OpenOfficeTM Writer o Apple® Pages
De PDF a EPUB
Convertir archivos PDF al formato EPUB facilita enormemente la lectura de libros o artículos electrónicos en un teléfono móvil o una tablet y le permite cambiar el tamaño de la fuente y ajustar el flujo de texto al tamaño de la pantalla.
De PDF a HTML
Convertir documentos PDF a HTML para publicar la información en la web puede ayudarle a ahorrar mucho tiempo y esfuerzo debido a que mantendrá la estructura de el documento original.