Prueba de scipy ks

Prueba de scipy ks

Python se reconoce como el lenguaje de programación de la computadora que le permite escribir los diferentes tipos de software y programas de computadora. Este idioma tiene criterios de nivel de alto rendimiento entre todos los demás idiomas y su paquete no solo se limita a algunos de los programas específicos o las tareas de software. Más bien, se conoce como un lenguaje para todo uso que se puede utilizar para escribir cualquier programa, ya sea un programa matemático, matrices y sus operaciones, implementación de las ecuaciones diferenciales o capacitar a un modelo de aprendizaje automático y la capacitación de un neuronal artificial red. Para cada tarea, su nombre de Python lo proporciona bajo una plataforma. Scipy es del lenguaje de programación de Python. Tiene módulos que importan la información necesaria al programa para las funciones construidas para los modelos de aprendizaje automático y de aprendizaje profundo. Scipy ofrece una de esas funciones como la "prueba KS" Scipy.

La prueba KS se reconoce como la "prueba de kolmogorov-smirnov" bajo la cual descubrimos de qué tipo/tipo de distribución es la muestra bajo la prueba. Hay dos métodos para realizar tales pruebas en función del número de muestras que damos a esta prueba como parámetros de entrada.

Procedimiento:

La prueba KS con sus dos tipos de funciones se explicará y demostrará prácticamente en este artículo. Este artículo ofrece un buen conocimiento de fondo sobre la introducción y la funcionalidad de la prueba KS. Luego, explica el método para escribir estas funciones en el script de Python con la discusión sobre sus parámetros que pertenecen a la lista de argumentos de entrada de ambas funciones.

Sintaxis:

Dado que ya sabemos por la explicación anterior que la prueba KS es de dos tipos en la naturaleza, la funcionalidad de ambas funciones es la misma, pero difieren ligeramente en su configuración en términos de su lista de argumentos. Una de las dos pruebas KS se conoce como la simple "prueba KS". Solo se necesita una muestra de datos y lleva a cabo la prueba de estos datos. El segundo es la "prueba de muestra KS_2". Esta prueba lleva a cabo la misma prueba de KS pero para los dos datos de muestra diferentes. La sintaxis para la prueba KS () y KS_2 se proporciona respectivamente en lo siguiente:

$ Scipy. estadísticas.kstest ()
$ Scipy. estadísticas.ks_2samp ()

Valor de retorno:

Ambas funciones mencionadas anteriormente devuelven el mismo tipo de resultado. Ambos devuelven dos valores, uno es el "estadístico" y el otro es el "valor p", donde el valor p es la principal toma de decisiones, ya sea que las muestras pertenezcan a la misma distribución o no.

Ejemplo 1:

Supongamos que tenemos una muestra de datos que pertenece o se generó con alguna distribución. Ahora, con la prueba KS, queremos saber de qué distribución pertenece estos datos. Suponemos un tipo de hipótesis nula que establece que los datos de la muestra provienen de la distribución normal y tenemos un 95 por ciento confiado en nuestra hipótesis. En otro caso, que es el caso alternativo, tenemos la opción de rechazar la hipótesis nula si el valor p que los rendimientos de la prueba KS tendrán el valor menor que el "0.05 ".

La hipótesis nula se rechaza si el resultado cae por debajo de 0.05, lo que indica que la muestra aleatoria ni siquiera provenía de una distribución normal. Llevamos a cabo una prueba KS para los datos de muestra que generaremos de manera única para este ejemplo. Tenga en cuenta que la plataforma Python en la que escribiremos el programa para este ejemplo es la "colaboración de Google".Abra el nuevo cuaderno en la colaboración y luego comience a escribir el programa. Importamos la biblioteca "Numpy" para usar su módulo para definir los datos con una distribución.

Integre este paquete Numpy como "NP" en el programa. La segunda biblioteca para agregar al programa es "estadísticas", que es un módulo de la biblioteca Scipy. Importarlos de las estadísticas de la biblioteca Scipy que luego agrega los módulos en el programa que se utiliza para el funcionamiento de la función kstest (). Asignar una variable suponiendo "x". Asigne el valor de los datos de muestra a esto llamando a las estadísticas a atribuir como "estadísticas.norma.RVS (size = 100, random_state = rng) ".

Con esta llamada, definimos los datos de la variable aleatoria utilizando la norma de estadísticas.Función de RVS para distribuir normalmente estos datos. La hipótesis nula es que esta muestra es de la distribución normal. El tamaño de estos datos se especifica como "200". Para verificar los resultados de la función kstest () en estos datos, pasamos estos datos al parámetro de la función kstest () como "estadísticas. kstest (x) ". La salida para el siguiente programa es la siguiente:

De las estadísticas de importación escasas
a = estadísticas.norma.RVS (tamaño = 200)
rslt = estadísticas.kstest (a, estadísticas.norma.CDF)
Imprimir (RSLT)

El valor p de la prueba KS es mayor thsan 0.05. Por lo tanto, no podemos rechazar la hipótesis de que los datos de la muestra pertenecen a la distribución estándar normal.

Ejemplo 2:

Ahora, realizamos otro tipo de prueba KS, que es la "KS_2Test". Toma los dos datos de muestra y comentarios si ambas muestras pertenecen a la misma distribución o no. Importar el módulo "STATS" de la biblioteca Scipy y declarar dos datos de muestra utilizando las "Estadísticas. norma. RVS (tamaño = 115) "y" estadísticas.norma.Métodos RVS (tamaño = 105) ", respectivamente. Guárdelos como "data1" y "data2". Esto genera los dos datos que tienen los tamaños de "115" y "105" con una distribución normal. La hipótesis nula es que ambos datos son del mismo tipo de distribución de "estándar normal". Para verificar esto, alimente estos dos datos a la "prueba KS_2" "como" estadísticas.ks_2samp (data1, data2) ”y verifique el valor p. El programa y las salidas se mencionan en lo siguiente:

El valor de la P no es inferior a 0.05. Entonces, la hipótesis nula que supusimos para estos datos es correcta y no tenemos derecho a rechazarlo.

datos1 = estadísticas.norma.RVS (tamaño = 115)
data2 = estadísticas.norma.RVS (tamaño = 105)
rslt = estadísticas.KS_2SAMP (data1, data2)
Imprimir (RSLT)

Conclusión

Realizamos las dos pruebas KS utilizando las diferentes funciones que la prueba KS ofrece para una muestra como "Estadísticas.ks test () "y para las dos muestras de datos como" ks_2samp () ". Según los resultados de las funciones, decidimos qué muestra de datos pertenece a qué tipo de distribución. En ambos casos, llegó a ser la distribución de tipo normal estándar.