Extraer páginas de PDF en Linux

Extraer páginas de PDF en Linux
Tratar con archivos PDF puede ser una gran molestia a veces ya que no son muy modificables. A menudo uno necesita extraer un puñado de páginas específicas de un documento enorme, y todo el recado puede sentirse muy laborioso. Esta es exactamente la razón por la que dedicaremos este tutorial para mostrarle los mejores métodos y las mejores herramientas que necesita para extraer páginas de archivos PDF en Linux.

Usando una herramienta en línea

Los archivos PDF se han convertido en uno de los medios más comunes para documentar y distribuir datos. Debido a su popularidad, muchos sitios web y programas están diseñados particularmente para manipular estos archivos. Hablando de eso, ILovePDF es un sitio web dedicado completamente a este propósito. Tiene muchas herramientas que puede usar de forma gratuita para dividir, fusionar, convertir, organizar, proteger y comprimir archivos PDF.

Dado que queremos extraer páginas de archivos PDF, utilizaremos la herramienta de divisor PDF ofrecida por el sitio web como se mencionó anteriormente. Una vez que tenga el documento PDF desde el que desea extraer páginas, haga clic aquí para visitar la herramienta de división PDF en línea.

Haga clic en el botón Seleccionar archivo PDF y navegue a su documento. Una vez que lo haya subido, puede seleccionar si desea extraer páginas o dividir el archivo por rango.

Continúe y seleccione las opciones que necesita en los botones en el lado derecho. Una vez terminado, haga clic en el PDF dividido, y eso debería ser. Inicializará la descarga de un .archivo zip que contiene sus páginas extraídas.

ILOVEPDF también tiene una aplicación descargable gratuita, pero desafortunadamente, solo está disponible para Windows y MacOS. Sin embargo, eso no le quita su capacidad para ayudarlo a extraer páginas de PDF en Linux, ya que también puede usarlo en línea. Dicho esto, ahora puede usar una herramienta de división PDF en línea completamente gratuita para seleccionar páginas específicas de archivos PDF y extraerlos sin ningún problema!

Usando pdfshuffler

Si por alguna razón, se deba a preocupaciones de privacidad o falta de funcionalidad, el método anterior no lo convenció, no, ya que tenemos recomendaciones más favorables para que lo pruebe.

Uno de los cuales es PDFSHuffler, una práctica aplicación Python-GTK que permite a sus usuarios manipular fácilmente archivos PDF. Sus características incluyen fusionar, dividir, recortar, girar y reorganizar archivos PDF. La herramienta se suma a su extensa funcionalidad a través de su interfaz gráfica fácil de entender e intuitiva.

Puede hacer clic aquí para descargar PDFSHuffler desde Source Forge, o puede hacerlo a través de la línea de comando a través de la línea de comando. Navegue al menú Actividades o presione Ctrl + Alt + T en su teclado para abrir una nueva ventana de terminal.

Después de haber hecho eso, ejecute los comandos a continuación a la primera verificación de actualizaciones y luego instale PDFSHuffler en su sistema Linux. (Estos comandos son para Ubuntu 20.04, pero otras versiones no deberían ser muy diferentes de estas).

$ sudo apt actualización
$ sudo apt install pdfshuffler

Una vez que se complete la instalación, busque el software recién instalado en el menú de actividades y ejecutarla. La pantalla predeterminada debe verse algo así como la imagen a continuación.

El siguiente paso es ingresar su archivo PDF en el programa haciendo clic en el botón de archivo y seleccionando la opción Agregar en el menú desplegable.

Una vez hecho esto, configure su configuración de extracción y divida el archivo. La salida debe darle las páginas extraídas deseadas del documento de entrada.

Usando PDFTK

Si tiene un aprecio especial por los programas de línea de comandos en lugar de los que se encuentran con interfaces gráficas, entonces PDFTK es el camino a seguir. Es una solución de CLI eficiente para los usuarios que necesitan extraer páginas específicas de archivos PDF. Permítanos ver cómo puede instalarlo en varias distribuciones de Linux y cómo usarlo.

Regrese a la ventana de su terminal o abra una nueva y ejecute los siguientes comandos si usa Ubuntu o Debian.

$ sudo apt install pdftk

Sin embargo, si no tiene habilitado el repositorio del universo, el comando mencionado anteriormente no funcionará. Puede habilitar este repositorio ejecutando el comando a continuación.

$ sudo add-apt-repositorio universo

Después de haber hecho eso, regrese al primer comando para instalar PDFTK.

Si está utilizando Arch Linux o una de sus variantes, ejecute el comando a continuación. (PDFTK es fácilmente accesible a través del repositorio de la comunidad).

$ Pacman -S PDFTK

Del mismo modo, si está en OpenSuse, ejecute el comando a continuación para instalar PDFTK.

$ sudo zypper instalación pdftk

Por último, si tiene Snap habilitado, también puede obtener esta herramienta a través de un comando snap.

$ sudo snap instalación pdftk

A continuación, echemos un vistazo al uso de PDFTK. Como mencionamos anteriormente, esta es una herramienta CLI, por lo que todo lo que necesita hacer es ejecutar un pequeño comando para obtener lo que necesita.

$ PDFTK Entrada.PDF CAT 3-4 Salida de salida_p3-4.pdf

Ahora, lo que está pasando en este comando? Primero, entrada.PDF es el documento que debe dividirse. El parámetro 3-4 especifica el rango de números de página, 3 a 4. A continuación, tenemos el nombre de archivo de salida, que es salida_p3-4.pdf. Simple, y deberías dominarlo en poco tiempo.

Sin embargo, es posible que no busque dividir un archivo PDF por un rango de números de página; Más bien, extraer un montón de páginas particulares en archivos PDF separados. No te preocupes, como puedes hacerlo a través de esta herramienta también. Todo lo que necesitas hacer es hacer un ligero cambio en el comando que mencionamos anteriormente. Este cambio se muestra a continuación.

$ PDFTK Entrada.PDF CAT 3 4 Salida de salida.pdf

Con eso hecho, puede dividir las páginas 3 y 4 y guardarlas como salida.pdf.

Conclusión

En esta guía, nos profundizamos mucho sobre cómo puede extraer páginas de los archivos PDF. Observamos una práctica herramienta en línea, luego un programa descargable basado en GUI y, por último, una solución de línea de comandos. Las herramientas mencionadas anteriormente son ricas en términos de características y deben hacer el trabajo fácilmente.