Matrices enmascaradas

Matrices enmascaradas

Cuando desee realizar cualquier cálculo estadístico o científico en Python, siempre corre hacia la biblioteca Scipy. La biblioteca Scipy es una de las bibliotecas de Python más utilizadas, ya que proporciona una función adecuada para todo tipo de computación matemática, estadística y científica. No es solo una biblioteca, sino un ecosistema completo de bibliotecas que se combinan para que pueda realizar cualquier tipo de tarea simple o compleja de manera fácil y rápida. Esta guía le permitirá explorar las funciones Scipy que se pueden usar con matrices enmascaradas.

¿Qué es una matriz enmascarada??

Una matriz enmascarada es una matriz que puede tener entradas inválidas o faltantes. En varios ocurrencias, los conjuntos de datos o matrices pueden contaminarse o estar incompletos por la presencia de datos no válidos. Por ejemplo, un sensor registró datos no válidos debido a múltiples razones o puede no haber podido registrar ningún dato. Ahora, tenemos un conjunto de datos vacío o un conjunto de datos lleno de entradas no válidas. La forma simple de lidiar con tales conjuntos de datos es enmascarar estas matrices. La biblioteca Numpy proporciona una función de enmascaramiento simple para enmascarar estos tipos de matrices. La biblioteca Scipy en sí no proporciona ninguna función de enmascaramiento que pueda usarse para enmascarar un conjunto de datos. Sin embargo, proporciona muchas funciones que se utilizarán con las matrices de máscara.

En esta guía, primero le guiaremos sobre cómo puede usar la biblioteca Numpy para enmascarar un conjunto de datos. Luego, demostraremos cómo las funciones de la biblioteca Scipy se pueden usar con matrices enmascaradas. En Numpy, la matriz enmascarada es una combinación de un ndarray estándar y una máscara. El valor de la máscara puede ser nomask o una lista de booleanos que especifican el enmascaramiento para cada valor en el conjunto de datos. Por ejemplo, si especifica el NomaSk para el valor de la máscara, eso significa que no hay un valor no válido en el conjunto de datos. Mientras que si especifica una matriz booleana para el conjunto de datos, cada valor determina el valor válido o no válido asociado con el conjunto de datos dado. Si el valor de la máscara es falso, el valor correspondiente en el conjunto de datos es válido, por lo que no se enmascarará. Si el valor de la máscara es verdadero, el valor correspondiente no es válido, por lo que se enmascarará. Ahora, veamos un ejemplo para tener una comprensión clara.

Ejemplo 1:

En este ejemplo, lo guiaremos sobre cómo enmascarar una matriz con la función de enmascaramiento numpy. Exploraremos cómo el "Numpy.La función MA ”funciona en un programa para enmascarar un conjunto de datos determinado. Considere el código de muestra dado:

importar numpy como np
importar numpy.Ma como ma
datos = np.Array ([2, 5, 8, -9, -7])
máscara = ma.Masked_array (Data, Mask = [0, 0, 0, 1, 1],
dtype = np.int8)
Imprimir ("La matriz enmascarada es: \ n", máscara)
imprimir ("\ n")
Mask_na = NP.mamá.Llenado (máscara.Astype (Float), NP.yaya)
Imprimir ("reemplazado por Nan: \ n", Mask_NA)

Primero, la biblioteca Numpy se importa al programa para usar las funciones de matriz y MA. La matriz se declara usando el NP.función array (). Entonces, la MA.Masked_array () se usa para enmascarar la matriz. Entonces, usamos el NP.mamá.función llena () para reemplazar los valores no válidos con valores NAN. Ahora, veamos el siguiente resultado:

Ejemplo 2:

Dado que entendemos cómo se utilizan las funciones numpy para enmascarar un conjunto de datos, veamos cómo usar las funciones escasas en la matriz enmascarada para realizar los cálculos según nuestros requisitos. En este ejemplo, enmascararemos una matriz con funciones numpy y utilizando una función escasa con las matrices enmascaradas. Considere el siguiente código de muestra:

importar numpy como np
importar numpy.Ma como ma
De Scipy.estadísticas.Mstats Import Describe
datos = np.Array ([2, 5, 8, -9, -7])
máscara = ma.Masked_array (Data, Mask = [0, 0, 0, 1, 1],
dtype = np.int8)
Imprimir ("La matriz enmascarada es: \ n", máscara)
imprimir ("\ n")
Mask_na = describir (máscara)
Imprimir ("La descripción de la matriz: \ n", Mask_NA)

La biblioteca Numpy se importa al programa ya que tenemos que usar la MA.Función Masked_Array () para enmascarar el conjunto de datos. La biblioteca Scipy, su paquete de estadísticas y la clase MSTATS se importan al programa para usar la función "Describe". La función "describir" se utiliza para obtener la descripción estadística de la matriz o el conjunto de datos especificados. La sintaxis de la función describe () es la siguiente:

El parámetro de "matriz" toma los datos de entrada. El parámetro "eje" se usa para definir el eje que se utilizará para la descripción. El parámetro "DDOF" se utiliza para encontrar el grado de libertad. Y el parámetro de "sesgo" se usa para definir el sesgo estadístico. Ahora, veamos la salida de la función de describir en el siguiente fragmento:

Ejemplo 3:

Usemos otra función Scipy en la matriz enmascarada para comprender el funcionamiento de la función con matrices enmascaradas. En este ejemplo, le mostraremos el uso de la función de modo junto con la matriz enmascarada. Considere el siguiente código de muestra:

importar numpy como np
importar numpy.Ma como ma
De Scipy.estadísticas import mstats
datos = np.Array ([2, 5, 8, -9, -7])
máscara = ma.Masked_array (Data, Mask = [0, 0, 0, 1, 1],
dtype = np.int8)
Imprimir ("La matriz enmascarada es: \ n", máscara)
imprimir ("\ n")
MASK_NA = MSTATS.Modo (máscara)
Imprimir ("El modo de matriz: \ n", Mask_NA)

La primera sección del programa es la misma que utilizamos en el ejemplo anterior. El conjunto de datos y el método para enmascarar la matriz son los mismos también. Solo cambiamos el método. Aquí, usamos la función de modo para encontrar el modo de la matriz enmascarada. La sintaxis de la función de modo es la siguiente:

El parámetro "matriz" se utiliza para proporcionar el conjunto de datos. El parámetro "eje" se usa para definir el eje que se utilizará para encontrar el modo de los datos. Ahora, veamos el modo de la matriz enmascarada de la siguiente manera:

Ejemplo 4:

La siguiente función de la biblioteca Scipy que se puede usar con una matriz enmascarada es ZSCORE (). La función ZScore se utiliza para calcular el ZScore de los datos dados. Considere el siguiente ejemplo de muestra:

importar numpy como np
importar numpy.Ma como ma
De las estadísticas de importación escasas
datos = np.Array ([2, 5, 8, -9, -7])
máscara = ma.Masked_array (Data, Mask = [0, 0, 0, 1, 1],
dtype = np.int8)
Imprimir ("La matriz enmascarada es: \ n", máscara)
imprimir ("\ n")
Mask_na = estadísticas.Zscore (máscara)
Imprimir ("El ZScore es: \ n", Mask_NA)

Una vez más, usamos el mismo programa y solo cambiamos la función Scipy para usarse con la matriz enmascarada. Como puede ver, pasamos la matriz enmascarada a la función ZSCORE. La sintaxis de la función ZScore es la siguiente:

El parámetro "matriz" se utiliza para proporcionar los datos a la función SZCore. El parámetro "eje" contiene el eje que se utilizará para calcular el ZScore. El parámetro "DDOF" se utiliza para definir el grado de corrección de la libertad. Por último, el parámetro "nan_policy" se usa para definir cómo manejar los valores nan. Ahora, veamos el siguiente resultado de la función ZScore:

Conclusión

Este artículo de Python es una visión general rápida de la matriz enmascarada de Scipy. Aprendimos que Scipy no proporciona ninguna función o método para enmascarar una matriz. Sin embargo, proporciona una lista de funciones simples y útiles que se pueden usar con matrices enmascaradas. La biblioteca Numpy ofrece la maestría.Función Masked_Array () para enmascarar la matriz y esa matriz enmascarada se puede pasar a cualquier función Scipy para realizar la operación deseada en los datos enmascarados.