Python Programming Language ofrece una variedad de bibliotecas increíbles que proporcionan una larga lista de funciones útiles. Usando estas bibliotecas y funciones, cualquier aplicación práctica se puede administrar fácilmente. En este artículo, explicaremos la función de CrosSstab disponible en la biblioteca Scipy. Scipy Library es una de las bibliotecas más utilizadas del lenguaje de programación de Python, ya que proporciona funciones para todo tipo de operaciones estadísticas y matemáticas. CrosStab es la función de otra biblioteca de Scipy en la que discutiremos en esta guía. Empecemos!
¿Qué es la tabla de crosstab??
Crosstab significa Tabulación cruzada que se utiliza para crear una tabla de contingencia de dos o más factores contando las frecuencias de los pares correspondientes. En palabras simples, devuelve una tabla que contiene el recuento de cada combinación única de los elementos en dos o más conjuntos de datos. Se puede utilizar para realizar un análisis de datos potente mediante la creación de una tabla de resumen.
En este artículo, demostraremos algunos ejemplos para mostrarle cómo usar la función de crosstab en un programa de Python. Con estos ejemplos, podrá comprender la función de una mejor manera y podrá implementarla en sus programas. Antes de pasar a la sección de ejemplos, comprendamos la sintaxis de la función de la tabla de crosstab.
¿Cuál es la sintaxis de la función de la tabla de crosstab??
La función de CrosStab es proporcionada por la biblioteca Scipy en el paquete de estadísticas y la clase de contingencia. La sintaxis de la función de la discusión es la siguiente:
Los conjuntos de datos de parámetros* representa la secuencia de conjuntos de datos cuya tabulación cruzada se debe calcular. El tamaño o los elementos deben coincidir con todos los conjuntos de datos. Los niveles y los parámetros escasos son parámetros opcionales. Si no se proporcionan, se utilizará su valor predeterminado. El argumento de los niveles contiene la lista de elementos que se contarán en los conjuntos de datos. El número de "niveles" y el número de conjuntos de datos deberían ser el mismo.
Los valores dados en el parámetro del nivel se cuentan en los conjuntos de datos. Si los valores correspondientes no existen en el conjunto de datos, serán ignorados y su recuento no se devolverá en la matriz resultante. El parámetro Spares contiene un valor verdadero o falso, lo que indica si devolver una matriz dispersa o no. Es falso por defecto.
La función de la discusión devuelve dos elementos: uno es una tupla de longitud y la otra es contar. La "tupla de longitud" contiene la secuencia de elementos que se cuentan. El elemento "recuento" contiene el recuento de cada par de contingencias que también se conoce como tabla de contingencia. Ahora que aprendimos la sintaxis de la función de la crosstab, veamos algunos ejemplos para comprender cómo se puede implementar la función de la discapacidad en un programa de Python.
Ejemplo 1:
Comencemos con un ejemplo simple para que no tengamos ningún problema para comprender el funcionamiento básico de la función de CrosStab. Considere el código de muestra en el siguiente fragmento de código:
De Scipy.estadísticas.Crosstab de importación de contingencia
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
(Avals, xvals), count = crosstab (a, x)
imprimir ('Array 1 contiene:', Avals)
print ('\ narray 2 contiene:', xvals)
imprimir ('\ nthe Count of Crosstab es: \ n', recuento)
Primero, la biblioteca SciPy junto con el paquete de estadísticas y la clase de contingencia se importan al programa para llamar a la función de CrosStab. Después de eso, se proporcionan dos matrices de la misma longitud. Ambos se pasan a la función de CrosSstab. Se declaran tres variables, cada una con un resultado único de la función de la tabla de crosstab. Ahora, veamos el resultado de la función de Crosstab en la siguiente:
La primera matriz contiene 2 elementos únicos: A y B. Mientras que la segunda matriz contiene tres elementos únicos: X, Y y Z. El recuento de contingencia es [[2, 2, 2] [2, 2, 2]], lo que significa que el par (a, x) ocurre dos veces, el par (a, y) ocurre dos veces, el par (a, z ) ocurre dos veces, el par (b, x) ocurre dos veces, el par (b, y) ocurre dos veces y el par (b, z) ocurre dos veces.
Ejemplo 2:
Como discutimos en el ejemplo anterior, el crosstab acepta tantos conjuntos de datos como pueda proporcionar. Calcula la tabla de contingencia para todos los conjuntos de datos. En el ejemplo anterior, solo proporcionamos 2 conjuntos de datos. Agreguemos uno más y veamos el resultado de la función de CrosSstab. Considere el siguiente código de muestra:
De Scipy.estadísticas.Crosstab de importación de contingencia
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
P = [0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
(Avals, XVals, Pvals), Count = CrosStab (A, X, P)
imprimir ('Array 1 contiene:', Avals)
print ('\ narray 2 contiene:', xvals)
print ('\ narray 3 contiene:', Pvals)
imprimir ('\ nthe Count of Crosstab es: \ n', recuento)
Ahora, veamos la siguiente salida para comprender cómo cambia el resultado de la tabla de crosstab:
Como teníamos tres conjuntos de datos, el primer conjunto de datos contiene dos elementos únicos: A y B. El segundo conjunto de datos contiene tres elementos únicos: X, Y y Z. Y el tercer conjunto de datos contiene dos elementos únicos: 0 y 1. Tenemos los siguientes pares (a, x, 0), (a, x, 1), (a, y, 0), (a, y, 1), (a, z, 0), (a, z, 1), (b, x, 0), (b, x, 1), (b, y, 0), (b, y, 1), (b, z, 0), (b, z, 1) , con recuentos [[[2 0] [0 2] [2 0]] [[0 2] [2 0] [0 2]]], respectivamente.
Ejemplo 3:
Como sabemos, Crosstab toma dos parámetros opcionales: uno es los niveles y el otro es escaso. En este ejemplo, lo guiaremos sobre cómo proporcionar explícitamente los parámetros de nivel y cómo la función de la crosstab lo maneja. Considere el siguiente ejemplo:
De Scipy.estadísticas.Crosstab de importación de contingencia
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, xvals), count = crosstab (a, x, niveles = (opt, opt))
imprimir ('Array 1 contiene:', Avals)
print ('\ narray 2 contiene:', xvals)
imprimir ('\ nthe Count of Crosstab es: \ n', recuento)
Como discutimos anteriormente, el número de niveles debe ser el mismo que el número de conjuntos de datos. Entonces, damos los niveles = (OPT, OPT) para que coincidan con el número de conjuntos de datos. Veamos la tabla de contingencia en la siguiente salida:
Ejemplo 4:
El segundo argumento opcional de la función de la tabla es escasa. En este ejemplo, definiremos explícitamente el parámetro disperso como verdadero para obtener la matriz dispersa como resultado. Considere el código de muestra en el siguiente fragmento de código:
De Scipy.estadísticas.Crosstab de importación de contingencia
a = ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b' ]
x = ['x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z', 'x', 'y', 'z' ]
opt = ['a', 'b', 'x', 'y', 'z']
(Avals, xvals), count = crosStab (a, x, niveles = (opt, opt), escaso = verdadero)
imprimir ('Array 1 contiene:', Avals)
print ('\ narray 2 contiene:', xvals)
Imprimir ('\ nthe Sparse Matrix es: \ n', Count)
imprimir ('\ nthe Count of Crosstab es: \ n', contar.A)
Aquí está la salida de la función de Crosstab que contiene todos los parámetros requeridos y opcionales:
Conclusión
Este artículo es una descripción general rápida de la función de Crosstab proporcionada por la biblioteca Scipy. Crosstab significa Tabulación cruzada. Se usa para obtener la tabla de contingencia de los datos dados. Se necesita una lista de conjuntos de datos, cuenta la contingencia de los elementos dados en el conjunto de datos y devuelve la matriz de recuentos. Con la ayuda de ejemplos, aprendimos cómo proporcionar los diferentes parámetros a la función y obtener el resultado deseado de ella.