El mejor texto de la línea de comando para aplicaciones de habla para Linux

El mejor texto de la línea de comando para aplicaciones de habla para Linux
Este artículo cubrirá una lista de aplicaciones útiles de texto a discurso (TTS) disponibles para Linux. Estas aplicaciones pueden identificar un texto, convertirlo en discurso y luego hablar palabras y oraciones a través de los altavoces de su sistema Linux. Convierten el texto en habla utilizando algoritmos de inteligencia artificial y modelos de aprendizaje automático previos a la aparición. Estas aplicaciones generalmente proporcionan una gama de voces diferentes que tienen tonos predefinidos, acento y forma de hablar. Algunas de estas aplicaciones le permiten configurar parámetros de voz como Tempo y Pitch. Es común que las aplicaciones de texto a voz tengan voces robóticas que no suenan como voces de la vida real. Sin embargo, la tecnología está mejorando y más voces de sonido humano están saliendo de estos texto a aplicaciones de habla.

Espeluznante

Espeak es un texto gratuito y de código abierto a utilidad del habla que se puede usar para convertir el texto en habla en muchos idiomas diferentes. Viene con una utilidad de línea de comandos, así como una biblioteca que se puede usar en su propia aplicación. La mayoría de las voces disponibles en espeak suena robótico, pero es uno de los textos de código abierto más completos y ampliamente utilizado disponible hoy en día. Admite convertir texto a discurso en más de 40 idiomas diferentes y también puede guardar el discurso en archivos de audio en formato de archivo WAV. También viene con soporte incorporado para convertir el texto en fonemas para que pueda usarlas en otras aplicaciones, incluidos otros motores de texto a voz.

Puede instalar EPSeak en Ubuntu utilizando el comando mencionado a continuación:

$ sudo apt instalación espeak

Puede descargar espeak en otras distribuciones de Linux del Administrador de paquetes. Más opciones de descarga están disponibles aquí.

Para convertir una pieza de texto a discurso usando espeak, use un comando en el siguiente formato:

El texto de $ espeak "se convertirá en discurso."

Puede reemplazar el contenido en citas con su propia cadena deseada. Para sintetizar el contenido completo de un archivo a discurso, ejecute un comando en el siguiente formato:

$ espeak -f nombre de archivo.TXT

Para cambiar el idioma y el estilo de voz, ejecute un comando en el siguiente formato:

El texto de $ espeak -v en -gb "se convertirá en discurso."

Puede reemplazar "en-gb" con el código de voz deseado. Se puede encontrar una lista de todas las voces disponibles y sus códigos ejecutando el siguiente comando:

$ Espeak -Voices

Para guardar el discurso sintetizado en un archivo WAV, ejecute un comando en el siguiente formato:

$ espeak -f nombre de archivo.Salida de TXT -W.wav

Puede reemplazar “Salida.wav ”con cualquier otro nombre de tu elección.

Para saber más sobre otras opciones de línea de comandos disponibles para espeak, use los siguientes dos comandos:

$ espeak --help
$ hombre espeak

Festival

El festival es otro texto gratuito y de código abierto al motor del habla que funciona de manera similar a Espeak. Proporciona una utilidad de línea de comandos para convertir el texto en discurso, así como una API que puede integrar en su propia aplicación. Otras características principales del festival incluyen soporte para convertir el texto en discurso en varios idiomas, intérprete interactivo incorporado, una API de cliente cliente para acceder a él de forma remota y su propio motor de secuencias de comandos.

Puede instalar Festival en Ubuntu utilizando el comando mencionado a continuación:

$ sudo apto install festival

Puede descargar el festival en otras distribuciones de Linux del Administrador de paquetes. Más opciones de descarga están disponibles aquí. Una demostración en línea que muestra las capacidades del festival está disponible aquí.

Para convertir una cadena en discurso, use un comando en el siguiente formato:

$ Echo "Test" | Festival -TTS

Puede reemplazar "prueba" con cualquier otra cadena de su elección. Para convertir el contenido de un archivo de texto en discurso usando el festival, ejecute un comando en el siguiente formato:

$ Festival -TTS FileName.TXT

Puede cambiar el lenguaje de voz ejecutando el comando a continuación:

$ Festival -Language americanEnglish -TTS File Name.TXT

Puede reemplazar "Americalenglish" con otros idiomas respaldados por el festival. Para obtener una lista de todos los idiomas compatibles, ejecute el comando a continuación:

$ ls/usr/share/festival/idiomas/

Para ejecutar el festival en modo interactivo, use el siguiente comando:

$ festival

Puede obtener más información sobre comandos específicos del modo interactivo desde aquí.

Para saber más sobre otras opciones de línea de comandos disponibles para el festival, ejecute los siguientes dos comandos:

$ festival --help
$ hombre festival

Texto de pico al motor del habla

PICO es un texto de código abierto y abierto al motor del habla que se incluye de forma predeterminada en el proyecto de código abierto de Android (AOSP). Los estilos de voz incluidos en Pico TTS suenan menos robóticos que Espeak y Festival. Actualmente, Pico TTS apoya la síntesis del habla en idiomas inglés, italiano, alemán, francés y español.

Puede instalar Pico TTS en Ubuntu usando el comando mencionado a continuación:

$ sudo apt install libttspico-uTils

Puede descargar Pico TTS en otras distribuciones de Linux desde el Administrador de paquetes. Alternativamente, puede compilarlo con el código fuente disponible aquí.

Pico TTS no tiene un comando para hablar directamente de discurso sintetizado de Stdout. Sin embargo, puede leer el contenido de un archivo de texto o una cadena y puede guardar el discurso sintetizado en un archivo WAV que luego se puede reproducir en cualquier reproductor de audio.

Para convertir una cadena en discurso y guardar la salida en un archivo WAV, ejecute un comando en el siguiente formato:

$ pico2wave -l en -en -w prueba.wav "prueba"

Puede reemplazar "prueba" con su propia cadena deseada. Para cambiar el idioma, reemplace "En-en" con códigos para otros idiomas compatibles. Pico TTS admite los siguientes códigos de idioma: EN-US, IT-IT, ES-ES, EN-GB, DE-DE Y FR-FR.

Para leer el contenido de un archivo y convertirlo en discurso, ejecute un comando en el siguiente formato:

$ pico2wave -l en -us -w prueba.wav "$ (prueba de gato.TXT)"

Puede reemplazar "Prueba.txt ”con cualquier otro nombre de archivo.

Para saber más sobre las opciones de línea de comandos Pico TTS, ejecute los siguientes dos comandos:

$ pico2wave --help
$ hombre pico2wave

GTTS

GTTS es una aplicación de línea de comandos y biblioteca basada en el texto de Google Translate a Speech Motor. Basado en Python, se puede usar para desarrollar otras aplicaciones TTS o puede usarlo como una utilidad de línea de comandos para sintetizar el habla del texto. Cuenta con voces de sonido mucho más naturales que otras utilidades mencionadas en este artículo, ya que el texto de Google Translate a Speech Engine se actualiza con bastante regularidad con nuevos algoritmos, voces y características de sonido natural.

Puede instalar GTTS en Ubuntu utilizando el comando mencionado a continuación:

$ sudo apt install python3-gtts

Puede descargar GTTS en otras distribuciones de Linux desde el Administrador de paquetes. Alternativamente, puede instalarlo desde el Administrador de paquetes PIP.

Para convertir una cadena en discurso, ejecute un comando en el siguiente formato:

$ gtts-cli 'prueba'-prueba de output.mp3

Puede reemplazar 'prueba' con cualquier cadena. El discurso sintetizado se guarda en la "prueba.archivo mp3 ". Puede usar cualquier nombre para el archivo de salida.

Para leer el contenido de un archivo y convertirlo en discurso, ejecute un comando en el siguiente formato:

$ gtts -cli -f prueba.prueba txt -output.mp3

Puede reemplazar "Prueba.txt ”con cualquier otro nombre de archivo.

Para especificar un lenguaje particular para sintetizar el habla, use un comando en el siguiente formato:

$ gtts -cli 'test' -l EN -output Test.mp3

Puede reemplazar "EN" con código para otros idiomas compatibles. Para obtener una lista de todos los códigos de idioma compatibles, ejecute el siguiente comando:

$ gtts-cli-todo

Para obtener más información sobre otras opciones de línea de comandos disponibles para GTTS, use los siguientes dos comandos:

$ man gtts-cli
$ gtts-cli --help

Conclusión

Estas son algunas de las mejores aplicaciones de texto a voz disponibles para Linux que vienen con soporte para sintetizar el habla en varios idiomas. Estas aplicaciones TTS se pueden usar de varias maneras, pero son especialmente útiles para mejorar la accesibilidad para las personas que sufren problemas de discapacidad visual.