Extraer y copiar los datos de una tabla en archivos PDF

CAPTCHA: Cómo funciona, y por qué existe
CAPTCHA: Cómo funciona, y por qué existe
6 Mayo, 2017
Programas para numerar páginas en un archivo PDF
Programas para numerar páginas en un archivo PDF
6 Mayo, 2017
Mostrar todos

Extraer y copiar los datos de una tabla en archivos PDF

Extraer y copiar los datos de una tabla en archivos PDF

Exportar tablas

Con Tabula podrás seleccionar y extraer una tabla de un archivo PDF y luego guardar la información de la misma en formato CSV, TLS, etcétera. Pero la plataforma también te permite seleccionar una fila o columna, para guardar los datos de una fila o columna de una tabla de un archivo PDF.

A diferencias de otros programas que extraen los datos de una tabla de un  archivo PDF (ByteScout PDF Multitool o 3*Four PDF), Tabula se caracteriza por sus sencillez y eficacia al momento de la extracción de las tablas.

Una vez descargado el programa desde su página oficial, observarás como se ejecutará una ventada CMD y se abrirá una pestaña del navegador Web predeterminado de tu ordenador que será la interfaz del entorno. (//127.0.0.1:8080/).

Interfaz Web
Interfaz Web

Lo primero que tienes que hacer es buscar el archivo PDF en tu equipo y posteriormente pinchar en el botón “Import”, en este punto la utilidad cargará el archivo PDF en la pestaña del navegador Web y lo dividirá en páginas.

También es un visualizador
También es un visualizador

Ahora eliges la página de la cual quieres extraer las tablas y con el ratón seleccionas la tabla (o parte de ella) y pinchas en el botón verde ubicado en la parte superior de la interfaz.

En nuestras pruebas todo funciono a la perfección
En nuestras pruebas todo funciono a la perfección

Pasarás a otro nivel del proceso, donde observarás la extracción del contenido de la tabla. Solo te resta seleccionar el formato de salida (CSV, TSV, JSON, ZIP de CSV o Script) y para finalizar la extracción tendrás que pinchar en el botón exportar o bien guardar la información en el portapapeles.

Como puedes observar trabajar con el entorno es realmente sencillo, pero si quieres hacer las cosas un poco más fáciles, podrás pinchar en el botón “Autodetected Tables” y la plataforma detectará todas las tablas de todas las página del PDF y lo extraerá en el formato que selecciones.

La exportación funciona muy bien
La exportación funciona muy bien

Realmente la herramienta es una de las opciones más sencillas para extraer tablas de un archivo PDF, pero su función de detectar todas las tablas de un documento y extraerlas en un archivo único, la destacan de otras utilidades similares.

Tabula es un programa gratuito que se encuentra disponible para sistemas operativos Windows y Mac OS X.

Fuente: www.neoteo.com
Contáctenos

Miraflores, Lima, Perú

Avenida José Pardo 582, oficina 205, Miraflores
Miraflores, Lima
+51 970771094
+51 6057735

Valencia, España

Carrer de José Iturbi, 1,
46950 Xirivella, Valencia
Cel: +34 605839188

New York, USA

70 E 116 St Manhattan, NY 10029
Cel: +1 347-531-7864
Tel: +1 212-860-3202

Yucatan, México

Calle 33ᴮ 544
García Ginerés
97070 Mérida, Yuc.
Tel: +52 9993541743
Vex Soluciones es una reconocida empresa de servicios IT cómo: Software / Sistemas web en la nube / Apps con presencia internacional. Perú, España, USA, Canada, México, Chile, Colombia, Argentina, Uruguay, Bolivia, Costa Rica, Puerto Rico, Republica Dominicana, Ecuador.
ventas@vexsoluciones.com