Scipy Mann Whitney

Scipy Mann Whitney
El lenguaje de programación de Python se usa comúnmente en ciencias de datos y análisis de datos. Los algoritmos simples, útiles, gratuitos y fáciles de entender del lenguaje de programación de Python nos permite realizar un análisis de datos en profundidad. Los algoritmos que se utilizan en las ciencias de los datos también son muy simples de aprender e implementar. Además, el lenguaje de programación de Python también ofrece varios paquetes, funciones y métodos útiles para realizar los cálculos matemáticos y estadísticos. Este artículo está estructurado en torno a explorar la función de prueba U Mann Whitney en Python.

Mann Whitney u prueba

Es una prueba de hipótesis estadística no paramétrica que se utiliza para comparar dos muestras de tamaño pequeño y tener una distribución de muestras no normal. Se considera igual a la prueba t de dos muestras donde dos muestras se eligen y determinan al azar si pertenecen a la misma población o no. Dado que es una prueba no paramétrica, no se hacen suposiciones para la distribución de la muestra. Sin embargo, algunas presunciones, como elegir al azar las muestras, la independencia mutua dentro de las muestras, mediciones de escala ordinal, etc. son hechos.

Python Scipy Mann Whitney Función

El lenguaje de programación de Python tiene una biblioteca increíble para realizar cualquier tipo de funciones matemáticas y estadísticas automáticamente y rápidamente. Esa biblioteca es Scipy, que es bien conocida entre todos los desarrolladores experimentados y principiantes. Proporciona una función Mannwhitneyu () para realizar la prueba U Mann Whitney. La sintaxis de la función Mannwhitneyu () es la siguiente:

Los parámetros de la función Mannwhitneyu () se utilizan para definir los datos y las características aplicadas a los datos. Los parámetros "X" e "Y" se utilizan para pasar las dos matrices de muestra multidimensionales que representan los datos de la muestra. El parámetro "alternativo" especifica la hipótesis alternativa para las muestras: menos, mayor, o dos lados. El parámetro "Use_Continuity" se utiliza para declarar si aplicar la corrección de continuidad o no. El parámetro "eje" define el eje en el que el cálculo estadístico tiene que realizar. El parámetro "nan_policy" define cómo lidiar con los valores de NAN en las muestras como aumentar una excepción, omitir o propagarse.

Y, por último, el parámetro de "método" especifica la forma de calcular el valor p como auto, exacto o asintótico. A cambio, la función Mannwhitneyu () proporciona el valor p y las estadísticas de las muestras. Entendamos cómo implementar la función Mannwhitneyu () en un programa de Python.

Ejemplo 1:

Este ejemplo toma dos muestras y las pase a la función Mannwhitneyu () sin especificar ningún otro parámetro. Verificaremos el resultado de la función Mannwhitneyu () con los valores predeterminados para cada parámetro opcional. Consideremos el ejemplo dado en el siguiente fragmento de código:

De las estadísticas de importación escasas
x = [5, 4, 10, 2, 9, 18, 20]
y = [12, 15, 25, 2, 9, 11, 13]
stat, p_value = estadísticas.Mannwhitneyu (x, y)
imprimir ("El valor estadístico de las muestras es =", stat)
imprimir ("El valor p de las muestras es =", p_value)

Aquí, incluimos la biblioteca Scipy junto con el paquete de estadísticas para que podamos usar la función Mannwhitneyu (). Al escribir cualquier programa de Python, debe recordar que las bibliotecas deben importarse al programa antes de usar cualquier función asociada con ellos. Algunas de las funciones incorporadas se pueden usar sin llamar explícitamente sus bibliotecas. Pero la mayoría de las funciones no se pueden usar en un programa si se pierde al agregar sus bibliotecas en el programa. Asegúrese de que todas las bibliotecas requeridas se incluyan antes de usar las funciones.

Después de agregar las bibliotecas, los dos conjuntos de muestras se declaran en X e Y. Estas muestras se pasan a la función Mannwhitenyu (). Ahora, verifiquemos la estadística y el p_value de las muestras dadas en la siguiente salida:

Ejemplo 2:

Declaramos explícitamente el valor de uno de los parámetros opcionales en este ejemplo. Como se discutió anteriormente, puede especificar la hipótesis alternativa para los datos de la muestra y podría ser menos, mayor o bilateral. De forma predeterminada, la función Mannwhitneyu () utiliza el valor "de dos lados" para el parámetro "alternativo". En este ejemplo, probaremos cada valor para el parámetro alternativo para comprender cómo funcionan con los datos de la muestra. Considere el siguiente ejemplo de muestra:

De las estadísticas de importación escasas
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
stat, p_value = estadísticas.Mannwhitneyu (x, y)
imprimir ("El valor estadístico de las muestras es =", stat)
imprimir ("El valor p de las muestras es =", p_value)

Aquí, no especificamos el valor para el parámetro "alternativo". Esto se hace para comparar el resultado del valor "alternativo" predeterminado con todas las demás opciones. Esto es lo que la función Mannwhitneyu () regresa cuando no especificamos el valor para ningún parámetro:

El valor predeterminado para la función Mannwhitneyu () es "dos lados" que especifica que las muestras dadas no son iguales. Aquí, damos el valor de "dos lados" para el parámetro "alternativo" para comparar los resultados. El mismo valor p se devuelve como lo hizo en el ejemplo anterior. Vamos a ver el siguiente resultado:

De las estadísticas de importación escasas
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
stat, p_value = estadísticas.Mannwhitneyu (x, y, alternativo = 'dos ​​lados')
imprimir ("El valor estadístico de las muestras es =", stat)
imprimir ("El valor p de las muestras es =", p_value)

Al comparar ambas salidas, podemos concluir que los resultados son los mismos.

El valor "mayor" para el parámetro "alternativo" verifica las muestras contra la hipótesis de que la muestra X dada es estocásticamente mayor que la muestra Y dada. Proporcionemos el valor "mayor" para el parámetro "alternativo" para verificar el valor p calculado:

De las estadísticas de importación escasas
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
stat, p_value = estadísticas.Mannwhitneyu (x, y, alternativo = 'mayor')
imprimir ("El valor estadístico de las muestras es =", stat)
imprimir ("El valor p de las muestras es =", p_value)

Aquí está el resultado del valor "mayor" para el parámetro "alternativo":

Como puede ver, el valor p es diferente del valor p en las salidas anteriores.

Por último, tenemos el valor "menos" para el parámetro "alternativo". El valor "menos" especifica que la muestra X dada es estocásticamente menor que la muestra Y dada. Pasemos el valor "menos" para el parámetro "alternativo" y ver el resultado:

De las estadísticas de importación escasas
x = [5, 4, 10, 2, 9, 18, 20, 4, 9, 11, 18, 20, 25, 30]
y = [12, 15, 25, 2, 9, 11, 13, 2, 5, 10, 18, 4, 30, 6]
stat, p_value = estadísticas.Mannwhitneyu (x, y, alternativo = 'menos')
imprimir ("El valor estadístico de las muestras es =", stat)
imprimir ("El valor p de las muestras es =", p_value)

La salida del valor "menos" para el parámetro "alternativo" es el siguiente:

Conclusión

Esta guía es una descripción general de la prueba U Mann Whitney, que también se conoce como la prueba de Wilcoxon Mann Whitney (MWW), la prueba de rango de Wilcoxon y la prueba de Wilcoxon Mann Whitney. Es una prueba no paramétrica que elige muestras independientes al azar y las compara con una hipótesis para especificar si pertenecen a la misma población o no o tienen la misma mediana o no. Además, no se hace presunción de distribución específica para calcular el valor p y las estadísticas de prueba. La biblioteca Scipy proporciona la función Mannwhitneyu () para realizar la prueba de Mann Whitney en los datos dados. Con la ayuda de ejemplos simples y fáciles, demostramos cómo implementar la función Mannwhitneyu () en un programa de Python.