Este artículo le mostrará cómo extraer tablas de documentos PDF. Es posible que tenga muchos archivos PDF que contengan varias tablas que desee utilizar por separado. Copiar y pegar esas tablas no es una buena opción, ya que puede no dar el resultado esperado, por lo tanto, necesita otras opciones simples que puedan extraer tablas de un archivo PDF y guardar esas tablas como archivos separados.

La mayoría de estos Herramientas de extracción de tablas PDF no puedo ayudar si se escanea la tabla PDF. En tal caso, primero debe hacer que el PDF se pueda buscar y luego probar estas opciones.

Extraer tablas de documentos PDF

En esta publicación, hemos agregado 2 servicios en línea gratuitos y 3 software gratuito para extraer tablas de un archivo PDF:

  1. PDF a XLS
  2. PDFtoExcel.com
  3. Tabula
  4. Multiherramienta ByteScout PDF
  5. Sejda PDF Desktop.

1]PDF a XLS

Servicio de PDF a XLS

PDF to XLS es una de las mejores opciones para extraer tablas de PDF. Tiene dos características que lo hacen útil. Puede buscar tablas de 20 PDF documentos juntos. Además, la extracción de la tabla PDF es automática. Genera la salida como un XLSX archivo. Si un PDF tiene varias tablas, cada tabla se almacena por separado en diferentes hojas de archivo XLSX de salida.

Abre la pagina de inicio de este servicio. Después de eso, arrastre y suelte archivos PDF o use SUBIR ARCHIVOS botón. Cada PDF cargado se convierte automáticamente a un archivo de formato XLSX. Cuando los archivos de salida estén listos, puede descargarlos uno por uno o descargar un archivo ZIP que contendrá todos los archivos de salida.

2]PDFtoExcel.com

Extraer tablas de documentos PDF

El servicio PDFtoExcel.com puede extraer tablas de un PDF a la vez, pero admite múltiples plataformas para cargar PDF. Apoya OneDrive, escritorio, Google Drivey Dropbox plataformas para cargar un PDF. Además, el proceso de conversión es automático.

Esta página de inicio de servicio es Aquí. Allí, seleccione una opción de carga para agregar PDF. Después de eso, automáticamente carga y convierte archivos PDF a Excel (XLSX). Cuando la salida esté lista, obtendrá el enlace de descarga para guardar el archivo de salida que contiene la (s) tabla (s) PDF.

Nota: Aunque este servicio menciona que también puede extraer tablas de archivos PDF escaneados, no funcionó para mí. Aún puede probarlo para PDF escaneado.

3]Tabula

Software de extracción de PDF Tabula

Tabula es un poderoso software que puede detectar automáticamente tablas presentes en un PDF y luego le permite guardar esas tablas como TSV, JSONo CSV archivo. Puede seleccionar la opción para guardar archivos CSV separados para cada tabla PDF o guardar todas las tablas en un solo archivo CSV.

Para descargar esto fuente abierta Extractor de mesa PDF, haga clic aquí. También requiere Java para ejecutarlo y utilizarlo correctamente.

Extraiga el archivo ZIP que descargó y ejecute tabula.exe archivo. Abrirá una página en su navegador predeterminado. Si la página no está abierta, agregue http: // localhost: 8080 en su navegador y presione Entrar.

Ahora verá su interfaz donde puede usar el Vistazo opción para agregar un PDF. Después de eso, presione Importar botón. Cuando se agrega el PDF, puede ver páginas PDF en su interfaz.

Utilizar Tablas de detección automática y resaltará todas las tablas presentes en ese PDF automáticamente. También puede resaltar manualmente una tabla seleccionando una tabla en particular. Si quieres, también puedes eliminar tablas seleccionadas de tu preferencia.

Esto le ayudará a guardar solo las tablas que desee. Cuando las tablas PDF estén resaltadas, haga clic en el Vista previa y exportación de datos extraídos botón.

Finalmente, use el menú desplegable disponible en la parte superior para seleccionar un formato de salida y presione Exportar botón. Esto guardará las tablas PDF en el archivo de formato de salida seleccionado por usted.

4]Multiherramienta ByteScout PDF

ByteScout PDF Multiherramienta: agregue pdf y detecte tablas


Como sugiere su nombre, este software viene con múltiples herramientas. Tiene herramientas como convertir PDF a TIFF multipágina, rotar documento PDF, hacer que no se pueda buscar PDF, optimizar PDF, agregar una imagen a PDF, y más. La función de detector de tabla PDF también está ahí, lo cual es bastante impresionante. La ventaja de esta herramienta es que puede extraer tablas de PDF escaneados también. Puede detectar tablas en varias páginas y luego extraer esas tablas como CSV, XLS, XML, TXTo JSON formato de archivo. Antes de la extracción, también le permite establecer un rango de páginas para extraer tablas solo de páginas específicas.

Puedes agarrar este software Aquí. Es Gratis para uso no comercial solamente. Después de la instalación, ejecute este software y use Abrir documento opción para agregar un PDF. Después de eso, haga clic en el Detectar tablas herramienta como se resalta en la imagen de arriba. Esta herramienta está presente en Extracción de datos categoría.

Se abrirá un cuadro donde puede establecer condiciones para detectar tablas. Por ejemplo, puede establecer un número mínimo de columnas, filas, saltos de línea mínimos entre tablas, establecer el modo de detección de tabla en una tabla con o sin bordes, etc. Utilice las opciones o mantenga la configuración predeterminada.

Después de eso, presione Detectar la siguiente mesa en ese cuadro. Identificará y seleccionará una tabla en la página actual. De esa manera, puede pasar a otra página y detectar más tablas.

detectar tablas y guardar tablas pdf con salida seleccionada

Cuando termines, usa Proceder a la extracción y seleccione el formato de salida. Finalmente, puede usar opciones para guardar las tablas de la página actual o definir un rango de página y guardar la salida.

La herramienta da un resultado satisfactorio. Pero a veces, puede detectar otro contenido en PDF y es posible que no pueda extraer tablas de varias páginas. En ese caso, debe usarlo para buscar y guardar tablas una por una.

5]Sejda PDF Desktop

Sejda PDF Desktop con convertidor de pdf a excel

Sejda PDF Desktop también es un software multipropósito. Puede optimizar o comprimir PDF, agregar marcas de agua a PDF, eliminar restricciones de PDF, editar documentos PDF, etc. Sin embargo, su plan gratuito tiene limitaciones. En el plan gratuito, solo se pueden realizar 3 tareas por día. Además, el límite de tamaño de PDF es 50 MB o 10 paginas.

Puedes usar su PDF a Excel herramienta de conversión para extraer tablas PDF. Detecta automáticamente las tablas en páginas PDF y le permite guardar esas tablas como XLSX o CSV.

Su enlace de descarga es Aquí. Después de la instalación, use la herramienta PDF a Excel desde su interfaz principal. Después de seleccionar esa herramienta, use Elija archivos PDF botón. Solo se puede agregar un PDF al plan gratuito.

Cuando se agrega el PDF, proporcionará Convertir PDF a CSV y Convertir PDF a Excel botones. Use un botón y luego puede guardar la salida en la ubicación deseada en su PC.

convertir tabla pdf a excel o csv

Su herramienta de detección de tablas PDF es buena. No es necesario que detecte tablas manualmente. Aún así, a veces puede incluir otro contenido de texto como una tabla PDF y almacenarlo en la salida. Pero los resultados generales son buenos.

Eso es todo.

Estas son algunas buenas herramientas para extraer tablas de PDF. El software Tabula es más eficaz que otras herramientas. Aún así, puede probar todas las herramientas y comprobar cuál ayuda.

Lecturas similares:

Extraer tablas de documentos PDF

Deja un comentario