Linuxhint ya publicó un tutorial que explica cómo instalar y comprender la capacitación de Tesseract.
Este tutorial muestra el proceso de instalación de Tesseract en los sistemas Debian/Ubuntu, pero no se extenderá en funcionalidades de capacitación, si no está familiarizado con este software que lee el artículo mencionado puede ser una buena introducción. Luego le mostraremos cómo procesar una imagen GIF con Tesseract para sacar el texto.
Correr:
APT install tesseract-ocom
Ahora necesita instalar ImageMagick, que es un convertidor de imagen.
Una vez instalado, ya podemos probar Tesseract, para probarlo, encontré un GIF con licencia para reutilizar.
Ahora veamos qué sucede cuando ejecutamos Tesseract en la imagen GIF:
Tesseract 2002NY40.GIF 1RESULT
Ahora haz un "menos" en 1Result.TXT
menos 1 resulto.TXT
Aquí está la imagen con su texto:
En esta configuración predeterminada de Tesseract, son bastante precisas, generalmente para obtener tal precisión, requiere capacitación. Probemos otra imagen gratuita que encontré en Wiki Commons, después de descargarla ejecutada:
Tesseract REATIZAR_GNULINUX_MERMINAL_APT-GET.gif 2result
Ahora revise el contenido del archivo.
menos 2resultas.TXT
Ese fue el resultado mientras el contenido de la imagen original era:
Para mejorar el reconocimiento de caracteres, tenemos muchas opciones y pasos a seguir que se detallaron en nuestro tutorial anterior: extracción de borde, eliminación de ruido, optimización de tamaño y rotación de páginas, entre otras funciones, como los cultivos.
Para este tutorial, usaremos TextCleaner, un script desarrollado por los scripts de ImageMagick de Fred.
Descargue el script y ejecute:
./TextCleaner -g -e STRING -F 25 -O 10 -S 1
Actualizar_gnulinux_ terminal_apt-get.prueba GIF.gif
Nota: Antes de ejecutar el script, otorgue permisos de ejecución al ejecutar "chmod +x textleaner"Como raíz o con sudo prefijo.
Dónde:
textleaner: Llama al programa
-gramo: Convierta la imagen a escala de grises
-mi: enache
-F: filtrar
-s: SharpAmt, cantidad de afilado de píxeles que se aplicarán al resultado.
Para obtener información y ejemplos de uso con TextCleaner, visite http: // www.FMWCONCECTS.com/imagemagick/textCleaner/índice.php
Al ver que TextCleaner cambió el color de fondo, aumentando el contraste entre la fuente y el fondo.
Si ejecutamos Tesseract, probablemente el resultado será diferente:
prueba de tesseract.gif testOutput
Menos testOutput
Como ve, el resultado realmente mejoró incluso cuando no es completamente preciso.
El comando convertir Proporcionado por ImageMagick nos permite extraer marcos de imágenes GIF que se procesarán más tarde por Tesseract, esto es útil si hay contenido extraable en diferentes marcos de la imagen GIF.
La sintaxis es simple:
convertir
El resultado se generará como número de archivos como cuadros en el GIF, en el ejemplo proporcionado, los resultados serían: salida-0.JPG, salida-1.JPG, salida-2.JPG, etc.
Luego puede procesarlos con Tesseract, instruyendo a que procese todos los archivos con un comodín guardando el resultado en un solo archivo ejecutando:
para i en salida-*; do tesseract $ i outputResult; hecho;
ImageMagick tiene una gran variedad de opciones para optimizar las imágenes y no hay un modo genérico, para cada tipo de escenario que debes leer la página de comandos de Convert.
Espero que hayas encontrado este tutorial en Tesseract que resulte útil.