Scipy tiene un atributo o función llamado "asociación ()."Esta función se define para saber cuánto están relacionadas las dos variables, lo que significa que la asociación es una medida de cuánto las dos variables o las variables en un conjunto de datos se relacionan entre sí.
Procedimiento
El procedimiento del artículo se explicará en pasos. Primero, aprenderemos sobre la función de asociación (), y luego sabremos qué módulos de los scipy deben trabajar con esta función. Luego aprenderemos sobre la sintaxis de la función de asociación () en el script de Python y luego haremos algunos ejemplos para obtener experiencia laboral práctica.
Sintaxis
La siguiente línea contiene la sintaxis para la llamada de función o la declaración de la función de asociación:
$ Scipy. estadísticas. contingencia. asociación (observada, método = 'cramer', corrección = falso, lambda_ = ninguno)
Discutamos ahora los parámetros requeridos por esta función. Uno de los parámetros es el "observado", que es un conjunto de datos o una matriz de matriz que tiene los valores bajo observación para la prueba de asociación. Luego viene el parámetro importante "método."Este método debe especificarse mientras usa esta función, pero su valor predeterminado es" Cramer."La función tiene otros dos métodos:" Tschuprow "y" Pearson."Entonces, todas estas funciones dan los mismos resultados.
Tenga en cuenta que no debemos confundir la función de asociación con el coeficiente de correlación de Pearson, ya que esa función solo dice si las variables tienen alguna correlación entre sí, mientras que la asociación dice cuánto o en qué medida las variables nominales están relacionadas con cada una otro.
Valor de retorno
La función de asociación devuelve el valor estadístico para la prueba, y el valor tiene el tipo de datos "flotar" de forma predeterminada. Si la función devuelve un valor de "1.0 ", esto indica que las variables tienen una asociación del 100%, mientras que un valor de" 0.1 "o" 0.0 "indica que las variables tienen poca o ninguna asociación.
Ejemplo # 01
Hasta ahora, hemos llegado al punto de discusión de que la asociación calcula el grado de relación entre las variables. Usaremos esta función de asociación y juzgaremos los resultados en comparación con nuestro punto de discusión. Para comenzar a escribir el programa, abriremos la "colaboración de Google" y especificaremos un cuaderno separado y único de la colaboración para escribir el programa en. La razón detrás del uso de esta plataforma es que es una plataforma de programación de Python en línea, y tiene todos los paquetes instalados de antemano.
Cada vez que estamos escribiendo un programa en cualquier lenguaje de programación, comenzamos el programa importando primero las bibliotecas en él. Este paso es importante ya que estas bibliotecas tienen la información de back-end almacenada en ellas para las funciones que estas bibliotecas tienen, al importar estas bibliotecas, agregamos indirectamente la información al programa para el funcionamiento adecuado de las funciones incorporadas. Importar la biblioteca "Numpy" en el programa como "NP", ya que aplicaremos la función de asociación a los elementos de la matriz para verificar su asociación.
Entonces otra biblioteca será "Scipy" y de este paquete Scipy, importaremos las "Estadísticas. Contingencia como asociación "para que podamos llamar a la función de asociación utilizando este módulo importado" Asociación."Hemos integrado todos los módulos requeridos en el programa ahora. Definir una matriz con la dimensión 3 × 2, utilizando la función de declaración de matriz numpy. Esta función utiliza el "NP" de Numpy como prefijo a Array () como "NP. Array ([[2, 1], [4, 2], [6, 4]])."Almacenaremos esta matriz como el" observado_array."Los elementos de esta matriz son" [[2, 1], [4, 2], [6, 4]] ", que muestra que la matriz consta de tres filas y dos columnas.
Ahora llamaremos al método de asociación () y en los parámetros de la función, pasaremos el "observado_array" y el método, que especificaremos como el "cramer."Esta llamada de función se verá como" asociación (observada_array, método = "cramer") ". Los resultados se almacenarán y luego se mostrarán utilizando la función print (). El código y la salida para este ejemplo se muestran de la siguiente manera:
El valor de retorno del programa es "0.0690 ", que establece que las variables tienen un menor grado de asociación entre sí.
Ejemplo # 02
Este ejemplo mostrará cómo podemos usar la función de asociación y calcular la asociación de las variables con dos especificaciones diferentes de su parámetro, I.mi., "método."Integre el" Scipy. estadística. El atributo de contingencia "como una" asociación "y el atributo de Numpy como" NP ", respectivamente. Cree una matriz 4 × 3 para este ejemplo utilizando el método de declaración de matriz Numpy, i.mi., "notario público. Array ([[100,120, 150], [203,222, 322], [420,660, 700], [320,110, 210]])."Pase esta matriz al método de asociación () y especifique el parámetro" Método "para esta función la primera vez como" Tschuprow "y la segunda vez como" Pearson."
Esta llamada de método se verá así: (observado_array, método = "tschuprow") y (observado_array, método = "Pearson"). El código para ambas funciones se adjunta a continuación en forma de fragmento.
Ambas funciones devolvieron el valor estadístico para esta prueba, que muestra el alcance de la asociación entre las variables en la matriz.
Conclusión
Esta guía muestra los métodos para las especificaciones del "método" del parámetro de la asociación de Scipy () basado en las tres pruebas de asociación diferentes que esta función proporciona: "Tschuprow", "Pearson" y "Cramer."Todos estos métodos dan casi los mismos resultados cuando se aplican a los mismos datos de observación o matriz.