Tabla de Contenidos

Manipulación de ebooks en GNU/Linux


PDFs: convertir páginas a imágenes para su tratamiento

Si eres poseedor de un ebook reader, seguramente te habrás encontrado con que los ficheros .epub de libros y novelas se leen a la perfección pero los ficheros PDF no se visualizan correctamente, normalmente debido a los márgenes "en blanco" que contienen y que acaban provocando que el texto en sí no ocupe la totalidad de la pantalla sino sólamente la parte central de la misma.

A continuación se detallan los pasos a realizar extraer las diferentes páginas de un fichero PDF como imágenes, tratarlas para recortar los bordes, y redimensionarlas al tamaño de pantalla de nuestro dispositivo. El objetivo es generar ficheros PDF, EPUB o CBR que contengan el mismo libro original pero eliminando los márgenes y con un tamaño de imagen que quepa completo en nuestra pantalla.

Para eso utilizaremos paquetes de software libre como convert (parte del paquete imagemagick) y pdfimages (del paquete poppler-utils).

Mi ebook reader es un bq Avant XL de 9", por lo que los ejemplos estarán adaptados a la resolución 1024x768 pero estas técnicas servirán también para un ebook reader estándar de 6" (600x800) modificando los valores en los scripts / línea de comandos que veremos.

Obviamente, el resultado dependerá del tipo de documento que estemos convirtiendo. En un ebook de 6" a 800x600 podremos ver perfectamente, por ejemplo, un comic manga de tamaño estándar como Dragon Ball, o un comic americano (ambos normalmente pequeños), pero será prácticamente imposible convertir y ver un comic tamaño folio tipo Asterix o una revista A4. Lo mismo ocurre con los libros. Un libro de tamaño típico (no tiene por qué ser bolsillo) escaneado se verá correctamente, pero algo de mayores tamaños puede no leerse en estas resoluciones.

Los pasos para la conversión serían:



Cada uno de los pasos anteriores se detallan a continuación. Vamos a ver todos los "pasos del procesado" por separado, pero lo ideal es aplicarlos en un único proceso, para evitar pérdida de calidad. Posteriormente veremos un script para automatizar esto:



<!-- * [[convertir_pdf_t_en_imagen|Convertir un PDF de texto en imágenes]]: Cómo convertir un PDF "de texto", en una ristra de imágenes para tratar. -->

Agrupando todos los pasos en un único "script":



Enlaces de interés


<Volver a la sección de GNU/Linux>