Zscore de scipy

Zscore de scipy
Cuando desea realizar un cálculo estadístico en Python, la primera biblioteca a la que se refiere es Scipy. El lenguaje de programación de Python tiene varias bibliotecas valiosas que puede usar en cualquier situación de acuerdo con su necesidad. Sin embargo, Scipy es una de las bibliotecas más comunes a las que puede recurrir para cada problema. Puede realizar cualquier tipo de cálculo estadístico, trabajo científico, cálculo matemático, etc. con Scipy. En este artículo, verá uno de los métodos estadísticos proporcionados por Scipy, que es ZScore. Nuestro objetivo es explorar y comprender la función ZScore proporcionada por la Biblioteca Scipy en este artículo con la ayuda de ejemplos. Empecemos!

Que es zscore?

En las estadísticas, la puntuación z es la diferencia entre la media y la desviación estándar. Usted toma un punto de sus datos, restas la media de él y luego la divide por la desviación estándar. En otras palabras, ZScore es la medida de la dispersión de los datos, por lo que dice cuántos valores se trata de la media de los datos de la desviación estándar de los datos. El ZScore negativo muestra que la desviación estándar está por debajo de la media, el 0 Z -Score muestra que la media y la desviación estándar son las mismas, y el ZScore positivo muestra que la desviación estándar está por encima de la media.

¿Qué es Scipy Zscore??

El ZScore es un método que se da en la biblioteca Scipy de Python. Se utiliza para calcular el ZScore automáticamente en el lenguaje de programación de Python. Todo lo que tiene que hacer es proporcionar sus datos y dejar que la función ZScore haga el trabajo. La sintaxis de la función ZScore se da en la siguiente ilustración para su comprensión:

El ZScore toma uno requerido y dos parámetros opcionales. El parámetro de la matriz representa la matriz de entrada u datos del objeto, y debe proporcionarse ya que se calcula su ZScore. El parámetro del eje es el eje al lado del cual se debe calcular la media. Es un parámetro opcional, por lo que si no lo menciona explícitamente, la función ZScore usa el valor predeterminado de 0. El parámetro DOF es otro parámetro opcional que representa el grado de libertad que se utiliza para corregir la desviación estándar. La función ZScore devuelve el ZScore de los datos dados. Ahora, aprendamos con la ayuda de ejemplos sobre cómo calcular el ZScore en un programa de Python. Considere los siguientes ejemplos.

Ejemplo 1:

Como se discutió anteriormente, el ZScore encuentra la diferencia entre la media y la desviación estándar. Por lo tanto, primero debemos tener una lista de datos de los cuales necesitamos calcular el ZScore. Este ejemplo explica el proceso paso a paso sobre cómo calcular el escoro Z de los datos proporcionados. Considere el código de muestra dado en el siguiente fragmento de código:

importar numpy como np
De las estadísticas de importación escasas
Array1 = [5, 10, 15, 20, 25]
Array2 = [2, 4, 6, 8, 10]
imprimir ("\ narray 1 contiene:", Array1)
print ("\ narray 2 contiene:", Array2)
imprimir ("\ narray 1 z-score: \ n", estadísticas.ZScore (Array1))
imprimir ("\ narray 2 z-score: \ n", estadísticas.ZScore (Array2))

Cuando necesitamos usar una función o método de una determinada biblioteca, necesitamos importar la biblioteca al programa antes de usar cualquiera de sus funciones para evitar errores. Entonces, como puede notar, primero importamos la biblioteca Numpy como NP y la biblioteca Scipy para importar el paquete de estadísticas. Después de importar las bibliotecas requeridas, proporcionamos dos conjuntos de datos diferentes para que podamos ver los diferentes resultados de la función ZSCORE. Ambas matrices se muestran en la pantalla usando el comando print (). Las matrices se pasan a la función ZScore para calcular el ZScore. Y el comando print () se usa nuevamente para mostrar el resultado. Ahora, veamos el siguiente resultado:

Ejemplo 2:

Como aprendimos sobre la sintaxis de la función ZScore, sabemos que se necesita un eje de parámetro opcional que es 0 por defecto. En este ejemplo, proporcionamos explícitamente el valor del eje 1 para explorar y comprender cómo la función ZScore cambia su cálculo. Considere el siguiente código de muestra:

importar numpy como np
De las estadísticas de importación escasas
Array1 = [[5, 10, 15, 20, 25], [4, 8, 2, 6, 10]]
Array2 = [[2, 4, 6, 8, 10], [1, 2, 5, 3, 9]]
imprimir ("\ narray 1 contiene:", Array1)
print ("\ narray 2 contiene:", Array2)
imprimir ("\ narray 1 Z-score a lo largo del eje 1: \ n", estadísticas.ZScore (Array1, eje = 1))
imprimir ("\ narray 2 z-score a lo largo del eje 1: \ n", estadísticas.ZSCORE (Array2, eje = 1))

Una vez más, las bibliotecas numpy y scipy se importan, ya que necesitamos que usen el paquete de estadísticas y la matriz Numpy junto con la función ZScore. Como puede notar, proporcionamos 2 matrices bidimensionales. El parámetro del eje se puede usar con matrices multidimensionales, por lo que utilizamos matrices bidimensionales en este ejemplo. El eje = 1 indica que el escoro Z calculado de cada punto de datos en las matrices es relativa a la matriz en la que se encuentran. Si compara el resultado de ambas matrices con el resultado que se calcula en el ejemplo anterior, puede notar que el resultado de la primera dimensión es el mismo ya que los datos son los mismos y el eje = 1. Ahora, veamos el siguiente resultado:

Ejemplo 3:

En los ejemplos anteriores, utilizamos los datos de matriz simples y definimos específicamente los datos en las matrices. También podemos definir un marco de datos para la función ZScore para calcular el ZScore de los datos en DataFrame. En este ejemplo, explicaremos cómo declarar un marco de datos y luego pasarlo a la función ZScore para calcular el ZScore de los datos dados. Considere el siguiente ejemplo de muestra para su comprensión:

importar pandas como PD
De las estadísticas de importación escasas
datos = PD.DataFrame (NP.aleatorio.randint (1, 10,
size = (3, 3)), columnas = ['x', 'y', 'z'])
datos.Aplicar (estadísticas.Zscore)

La biblioteca pandas se importa al programa como PD ya que la función DataFrame () es proporcionada por la biblioteca PANDAS. La biblioteca Scipy se importa, como de costumbre, a medida que utilizamos la función ZSCORE. DataFrame () se declara con valores aleatorios utilizando el aleatorio.función randint (). El tamaño del marco de datos recibe 3 x 3, lo que significa 3 filas y 3 columnas. Los nombres para cada columna son "x", "y" y "z". DataFrame () se pasa a la función ZScore para calcular el ZScore de cada punto de datos. Ver el siguiente resultado:

Conclusión

Este artículo es una descripción general rápida de la función ZScore proporcionada por la biblioteca Scipy. En Python, el ZScore es una función proporcionada por la biblioteca Scipy que se utiliza para calcular el ZScore de los datos dados automáticamente. Esta guía proporcionó algunos ejemplos para explicar cómo usar la función ZScore en un programa de Python.