Chi-cuadrado

Chi-cuadrado
Python es un lenguaje de programación de nivel de alto rendimiento bien conocido que permite varias funciones y operaciones de ingeniería, técnica, orientada a objetos y matemáticas. Python ofrece numerosas bibliotecas para sus usuarios y uno de los lenguajes de programación más reconocidos y de código abierto es "Scipy". La biblioteca Scipy contiene información y aplica sus operaciones a diferentes métodos de aprendizaje automático e.gramo., Algoritmos de aprendizaje automático y los optimizadores que utilizamos en sistemas artificialmente inteligentes. Utilizamos un módulo chi-cuadrado de la biblioteca Scipy para realizar la prueba diversa para los datos categóricos.

Procedimiento

En el artículo, utilizaremos la función de chi-cuadrado de la biblioteca Scipy y tomaremos varias pruebas para los datos. La información sobre el uso de esta función en el script de Python también se discutirá y aplicará a varios ejemplos en este artículo.

Sintaxis

Dado que llevaremos a cabo las dos pruebas para verificar la relación entre las variables utilizando el método de chi-cuadrado, discutiremos las dos sintaxis diferentes para esta función.

Prueba de Chi Square -> $ Chisquare (F_OBS, DDOF = 1, F_EXP = NINGUNO, AXIS = 1)

Prueba de independencia de Chi Square -> $ chi2_contingency (observado, lambda_ = none corrección = falso)

Valor de retorno

Esta función devuelve el valor p y el valor estadístico de prueba de chi cuadrado en su salida.

Ejemplo # 01

Realizaremos la primera prueba utilizando el cuadrado chi que hemos discutido en la sintaxis como prueba de chi_square. Esta prueba nos cuenta sobre la relación entre las variables categóricas. Esta función utiliza el módulo de "estadísticas" de atributo desde el scipy. Las estadísticas calculan la prueba donde tenemos que asumir una hipótesis nula y el cuadrado chi prueba esta hipótesis nula si los datos contienen o no las frecuencias especificadas o no. Toma las frecuencias observadas y esperadas como sus parámetros y si estas dos frecuencias son menores o no al menos "cinco", la prueba se considera inválida.

Ejecutaremos la misma prueba en el ejemplo, el compilador que utilizaremos para implementar el ejemplo es "Google Collab" que sirve como un compilador de código abierto. Ejecuta el programa sin ninguna entrega de los paquetes de la biblioteca, ya que ya tiene los paquetes instalados en él. Después de abrir el compilador, simplemente cree un proyecto con un nombre único y luego pase al siguiente paso donde importaremos los paquetes de la biblioteca para ejecutar la prueba de Chi Square.

La prueba de Chi Square se da en el módulo de estadísticas de Python Scipy, por lo que importaremos las "estadísticas" de los SciPy en nuestro proyecto. Una vez que hayamos importado esta biblioteca, definiremos una matriz que tenga los elementos como las frecuencias al menos mayores o iguales a cinco. Entonces, vamos a definir la matriz con el nombre de "matriz" con las frecuencias observadas como "[3, 4, 6, 8, 10, 2]". Después de crear con éxito esta matriz, llamaremos a la función Chi Square con el prefijo "estadísticas" como "estadísticas. Chisquare () ". Al argumento de entrada de esta función, pasaremos la matriz, que es el F_OBS (frecuencia observada) el parámetro de la función chi cuadrado.

Después de ejecutar el código mencionado en el fragmento a continuación, obtendremos la salida como la estadística de Chi Square y el valor P. Esta prueba de chisquare será válida ya que hemos definido al menos cinco frecuencias observadas en el parámetro de esta función.

De las estadísticas de importación escasas
matriz = [3,4,8,10,12]
estadísticas.Chisquare (matriz)

Ejemplo # 02

La función Chi Square tiene otra prueba para las variables categóricas con el nombre de la "prueba chi_square para la independencia". Ahora, esta prueba es ligeramente diferente de la prueba de chi-cuadrado que hemos discutido en el ejemplo anterior, ya que esta prueba verifica si existe alguna relación significativa entre las dos variables de la clase categórica. Para esta prueba, Chi_square utiliza la función del módulo de estadísticas "contingencia chisquare" de Python Scipy. La prueba se realiza para mostrar si las variables son independientes entre sí o no. Para trabajar con esta función, creemos otra nueva matriz. Para crear y definir esta nueva matriz, tendremos que importar el Numpy con el nombre "NP" para que podamos llamar al "NP" en el código más adelante en lugar de Numpy.

Otro paquete de biblioteca importante que debe importarse para el funcionamiento adecuado de la prueba de contingencia de Chi Square son las "estadísticas". Importaremos el módulo de estadísticas de la biblioteca Scipy desde el idioma Python. Con la importación exitosa de las bibliotecas requeridas para el proyecto o la prueba de independencia de Chi Square, en el siguiente paso, definiremos una matriz con el nombre "Obs_array". Usaremos "NP. método array () "para crear esta matriz y las dimensiones de la matriz se establecerán en 2-dimensiones y los elementos que esta matriz contendrá será como" ([2, 2, 2], [8, 8, 8] ) ". Esta matriz se utilizará como la observación, que es el parámetro de entrada para la función chi_2 contingency ().

Para llamar a la prueba de contingencia para la independencia de las dos variables que pertenecen a las clases categóricas, usaremos las estadísticas de prefijo y llamaremos a la función chi_2contingency como "estadísticas.chi2_contingency (obs_array) ". Ejecutaremos el siguiente código que se muestra en la figura para obtener los resultados para la prueba de independencia de la función de contingencia de chi cuadrado.

importar numpy como np
De las estadísticas de importación escasas
obs_array = np.Array ([[2, 2, 2], [8, 8, 8]])
estadísticas.chi2_contingency (obs_array)

Esta función devuelve el valor de estadísticas de prueba de chi cuadrado, el valor p de la prueba y los valores de esas frecuencias que son esperadas para las observaciones que pasamos en los parámetros de la función. La salida de la función se muestra en la figura a continuación.

Conclusión

El artículo proporciona información detallada sobre el método Chi Square que utiliza el módulo "Estadísticas" de la biblioteca Scipy. Hemos realizado dos tipos de pruebas para los métodos Chi Square mediante la implementación de los dos ejemplos diferentes en el script de Python y hemos mostrado cómo se ve la salida o los valores de retorno de esta función y lo que significan en el contexto del cuadro Scipy Chi ( ) método.