"El paquete Numpy de Python ofrece una función llamada" Corrcoef "; Esta función se usa cada vez que tenemos que calcular los coeficientes de correlación para el "Producto Product-Momente". Los coeficientes de correlación que calculamos para el momento de productos de Pearson hablan sobre el alcance de la correlación entre las dos variables. Estos coeficientes de correlación a menudo se calculan cuando los dos gráficos se trazan en la gráfica dispersa, y esperamos que la relación entre estas variables esté más inclinada hacia la relación lineal, por lo que utilizando el coeficiente de correlación, estimamos la afiliación lineal entre las variables y Estos coeficientes de correlación se representan como "R".
Se sabe que el Numpy es la biblioteca más reconocible de Python, y todas las operaciones (matemáticas y algebraicas) se pueden aplicar en las matrices ND utilizando las funciones que ofrece este paquete de biblioteca."
Procedimiento
Este artículo mostrará el método para estimar la correlación entre las dos variables utilizando la función Numpy CorrCoef (). Aprenderemos el método para escribir el programa en el script de Python para esta función prácticamente ejecutando el programa en el compilador de Python para diferentes ejemplos.
Sintaxis
Las funciones tomarán las variables o las matrices, y las correlaciones entre esas matrices serán calculadas por la función y se devolverán como la salida de la función.
numpy. CorrCoef (x, y = ninguno, rowvar = true, sias =, ddof =, dtype)
La "x" y "y" son las matrices que tenemos que especificar para calcular los coeficientes de correlación de la variable. "Row Var" es un parámetro opcional; Si su valor se establece en True, que también es su valor predeterminado, entonces la función considera que cada fila es una variable de otra manera para el caso de falso cada columna representa una variable. "Dtype" es el tipo de datos cuyo valor predeterminado es el "flotador" para la salida y el resto dos parámetros "sesgo" y "ddof" son opcionales o no se consideran, por lo que no nos molestamos en usarlos.
Valor de retorno
El valor de retorno para el método numpy corrcoef () será los coeficientes de correlación que revelará la correlación entre las variables.
Ejemplo # 01
Cuando trabajamos en estadísticas y ciencia de datos, sabemos que estos dos campos están más preocupados por conocer la relación entre las variables en el conjunto de datos. Cada punto de datos en un conjunto de datos es la observación, y las propiedades de cada observación se representan como una característica, y estas características son las variables del conjunto de datos. Y cualquier conjunto de datos que usemos acuerdos con la función o las variables y observaciones.
Para comprender la correlación entre las características, piense en un ejemplo de "cómo la precisión en disparar el baloncesto al objetivo del jugador se ve afectado por la altura del jugador". Ahora hemos aprendido qué es exactamente la característica y cuánto es importante saber sobre su correlación. Entonces, con eso, exploremos esta función CorrCoef () implementándola en las matrices ND para encontrar la correlación entre las características de las matrices. El software que utilizaremos para implementar el ejemplo es "Spyder", que tiene paquetes de biblioteca instalados en él.
Comenzaremos por escribir el programa e importaremos el módulo Numpy desde la biblioteca Numpy; Esto es obligatorio trabajar con las matrices ND. Avanzaremos al siguiente paso y crearemos dos matrices (unidimensionales) llamando al "NP. método array () "y nombrará las matrices" arr_1 "y" arr_2 ", respectivamente. Podemos inicializar las matrices con elementos aleatorios, por lo que para el ejemplo, las especificaremos como "[3, 6, 9]" para ARR_1 y "[4, 7, 8]" para ARR_2. Ahora queremos saber sobre la correlación entre estas dos matrices, por lo que reenviaremos estas matrices al argumento de entrada de la función "NP. CorrCoef (ARR_1, ARR_2) "y luego se muestre los resultados de esta función. El código para este ejemplo se reescribe en el lenguaje de programación "Python" de la siguiente manera:
La función devolvió una matriz 2D de los coeficientes de correlación que tienen el tipo de datos predeterminado "flotación". Con estos coeficientes de correlación, ahora podemos estimar la linealidad en la relación entre dos o incluso más de dos variables. Para este ejemplo, si observamos la matriz 2D, los valores diagonales superiores son "1" Esto se debe a que estos valores son la correlación entre ARR_1 y ARR_1 y ARR_2 con ARR_2, mientras que los valores de la izquierda inferior y superior son los valores de la derecha superior son los correlación entre ARR_1 y ARR_2 y son mismas y tienen el valor "0.96 ", y esto representa los coeficientes de correlación de productos de productos de Pearson.
Ejemplo # 02
Este ejemplo tomará el CorrCoef () para las matrices bidimensionales, y definiremos estas dos matrices por el método "NP. array () ". Los elementos para ambas matrices serán "([3, 6, 9], [4, 7, 8])" y "([6, 3, 8], [2, 5, 12])", respectivamente. Nombraremos estas dos matrices 2D "ARR_1" y "ARR_2", y luego pasaremos estas matrices al método Numpy CorrCoef () y guardaremos los resultados de esta función y los mostraremos usando el método Pint (). El código para este ejemplo se muestra en la figura adjunta a continuación. Copiaremos ese código y haremos que se ejecute en el compilador "Spyder".
La salida ha mostrado la matriz de cuatro dimensiones que tiene los coeficientes de correlación como sus elementos con el tipo de datos flotante. Estos coeficientes representan la relación entre las matrices bidimensionales que habíamos declarado en el ejemplo. Del artículo, observe que la diagonal superior tiene el mismo valor de 1, que muestra que son los coeficientes de correlación para las mismas variables, y los valores en otros lugares varían; Esto se debe a que estos valores muestran la correlación entre las diferentes variables.
Conclusión
Esta guía cubre la función de coeficiente de correlación para el "Productment de Pearson". Hemos demostrado en el artículo cómo podemos aplicar esta función en las matrices unidimensionales y multidimensionales y en qué forma la función devolverá la salida para las matrices ND. Hemos analizado más a fondo las salidas de la función para los dos ejemplos diferentes.