Cómo ejecutar Tesseract en el archivo GIF en Linux

Cómo ejecutar Tesseract en el archivo GIF en Linux
Tesseract es un sistema OCR (reconocimiento de caracteres ópticos), entre los mejores. El software OCR es capaz de comprender el texto de imágenes y documentos escaneados (incluida la escritura a mano si lo capacita). Un sistema OCR puede ser útil para muchas tareas, como documentos escaneados de conteo de palabras, transcripción automática, conversión de caracteres de imagen a texto y más.

Linuxhint ya publicó un tutorial que explica cómo instalar y comprender la capacitación de Tesseract.

Este tutorial muestra el proceso de instalación de Tesseract en los sistemas Debian/Ubuntu, pero no se extenderá en funcionalidades de capacitación, si no está familiarizado con este software que lee el artículo mencionado puede ser una buena introducción. Luego le mostraremos cómo procesar una imagen GIF con Tesseract para sacar el texto.

Instalación de Tesseract:

Correr:

APT install tesseract-ocom

Ahora necesita instalar ImageMagick, que es un convertidor de imagen.

Una vez instalado, ya podemos probar Tesseract, para probarlo, encontré un GIF con licencia para reutilizar.

Ahora veamos qué sucede cuando ejecutamos Tesseract en la imagen GIF:

Tesseract 2002NY40.GIF 1RESULT

Ahora haz un "menos" en 1Result.TXT

menos 1 resulto.TXT

Aquí está la imagen con su texto:

En esta configuración predeterminada de Tesseract, son bastante precisas, generalmente para obtener tal precisión, requiere capacitación. Probemos otra imagen gratuita que encontré en Wiki Commons, después de descargarla ejecutada:

Tesseract REATIZAR_GNULINUX_MERMINAL_APT-GET.gif 2result

Ahora revise el contenido del archivo.

menos 2resultas.TXT


Ese fue el resultado mientras el contenido de la imagen original era:

Para mejorar el reconocimiento de caracteres, tenemos muchas opciones y pasos a seguir que se detallaron en nuestro tutorial anterior: extracción de borde, eliminación de ruido, optimización de tamaño y rotación de páginas, entre otras funciones, como los cultivos.

Para este tutorial, usaremos TextCleaner, un script desarrollado por los scripts de ImageMagick de Fred.

Descargue el script y ejecute:

./TextCleaner -g -e STRING -F 25 -O 10 -S 1
Actualizar_gnulinux_ terminal_apt-get.prueba GIF.gif

Nota: Antes de ejecutar el script, otorgue permisos de ejecución al ejecutar "chmod +x textleaner"Como raíz o con sudo prefijo.

Dónde:

textleaner: Llama al programa

-gramo: Convierta la imagen a escala de grises

-mi: enache

-F: filtrar

-s: SharpAmt, cantidad de afilado de píxeles que se aplicarán al resultado.

Para obtener información y ejemplos de uso con TextCleaner, visite http: // www.FMWCONCECTS.com/imagemagick/textCleaner/índice.php

Al ver que TextCleaner cambió el color de fondo, aumentando el contraste entre la fuente y el fondo.

Si ejecutamos Tesseract, probablemente el resultado será diferente:

prueba de tesseract.gif testOutput
Menos testOutput

Como ve, el resultado realmente mejoró incluso cuando no es completamente preciso.

El comando convertir Proporcionado por ImageMagick nos permite extraer marcos de imágenes GIF que se procesarán más tarde por Tesseract, esto es útil si hay contenido extraable en diferentes marcos de la imagen GIF.

La sintaxis es simple:

convertir

El resultado se generará como número de archivos como cuadros en el GIF, en el ejemplo proporcionado, los resultados serían: salida-0.JPG, salida-1.JPG, salida-2.JPG, etc.

Luego puede procesarlos con Tesseract, instruyendo a que procese todos los archivos con un comodín guardando el resultado en un solo archivo ejecutando:

para i en salida-*; do tesseract $ i outputResult; hecho;

ImageMagick tiene una gran variedad de opciones para optimizar las imágenes y no hay un modo genérico, para cada tipo de escenario que debes leer la página de comandos de Convert.

Espero que hayas encontrado este tutorial en Tesseract que resulte útil.