Dictado a texto

Dictado a texto
El reconocimiento de voz es una técnica que convierte la voz humana en texto. Este es un concepto muy importante en el mundo de la inteligencia artificial donde tenemos que dar comandos a una máquina como un automóvil sin conductor, etc.

Vamos a implementar el discurso en el texto en Python. Y para esto, tenemos que instalar los siguientes paquetes:

  1. Reconocimiento de voz de PIP Instalar
  2. PIP install Pyaudio

Por lo tanto, importamos el reconocimiento de voz de la biblioteca e inicializamos el reconocimiento de voz porque sin inicializar el reconocimiento, no podemos usar el audio como entrada, y no reconocerá el audio.

Hay dos formas de pasar el audio de entrada al reconocimiento:

  1. Audio grabado
  2. Usando el micrófono predeterminado

Entonces, esta vez estamos implementando la opción predeterminada (micrófono). Es por eso que estamos obteniendo el micrófono del módulo, como se muestra a continuación:

Con Linuxhint.Micrófono () como micrófono

Pero, si queremos usar el audio pregrabado como entrada de origen, entonces la sintaxis será así:

Con Linuxhint.Audiofile (nombre de archivo) como fuente

Ahora, estamos utilizando el método de registro. La sintaxis del método de registro es:

Registro (fuente, duración)

Aquí la fuente es nuestro micrófono y la variable de duración acepta enteros, que son segundos. Pasamos la duración = 10 que le dice al sistema cuánto tiempo el micrófono aceptará la voz del usuario y luego la cierra automáticamente.

Entonces usamos el reconocimiento_google () Método que acepta el audio y encubria el audio a un formulario de texto.

El código anterior acepta la entrada del micrófono. Pero a veces, queremos dar información del audio pregrabado. Entonces, para eso, el código se da a continuación. La sintaxis para esto ya se explicó anteriormente.

También podemos cambiar la opción de idioma en el método Reconoce_Google. A medida que cambiamos el idioma del inglés al hindi, como se muestra a continuación: