Varianza de pandas

Varianza de pandas
"The" Pandas "es una biblioteca de software escrita en el lenguaje de Python para realizar el análisis y la manipulación de datos. ¿Qué pasa si queremos saber el grado de difusión en su marco de datos?? La varianza se utiliza para llevar a cabo esta tarea. Se utiliza para representar una medición entre los números en los datos de la propagación. Los pandas han creado la función de varianza, que indicará el grado del conjunto de datos. La función para la varianza panda es "var ()". Cuantos más datos se extiendan, más es la varianza en relación con la media. Más adelante, realizaremos toda cómo se puede usar la varianza de los pandas. Para la implementación del código en el ejemplo, utilizaremos el software "Spyder", un software Python Language’s Software."

Sintaxis

# "DF.var () "

Se emplea la sintaxis anterior para calcular la varianza en el marco de datos. El "DF" en la sintaxis representa el "marco de datos".

Ejecutaremos el siguiente método para la explicación de ejemplo de la función de la varianza PANDAS:

  • Cálculo de varianza de pandas para una sola columna en el marco de datos.
  • Cálculo de varianza de pandas de una sola columna en el marco de datos cambiando el argumento.
  • Cálculo de varianza de pandas para múltiples columnas en el marco de datos.
  • Varianza de PANDAS para el cálculo de las columnas completas de DataFrame.

Creación de DataFrame para la implementación de ejemplo de la varianza PANDAS

Abra la herramienta "Spyder" en su escritorio/computadora portátil. Ahora, primero, importe la Biblioteca Pandas como "PD" mientras estamos ejecutando en el entorno de Panda. Creemos un DataFrame; El "DF" consiste en los nombres "Tom", "Eddie", "Sam", "Leo" y "Nick" con sus edades como "25", "44", "66", "55" y "78 ". Tenemos los datos faltantes de las edades como "20", "30", "40", "50" y el "valor faltante" también tenemos sus ingresos en el marco de datos como "78000", "70000", "66000" , "33000" y "68000". Y luego, imprimiremos la condición "DF" que se utilizará para construir DataFarame.

Se crea DataFrame a medida que vemos la pantalla que muestra las columnas y el valor que asignamos en el código. Podemos ver que hay una "nan" escrita en la columna de datos faltante en la última, lo que significa que "no es un número" y no hay valor asignado allí.

Ejemplo # 01: Cálculo de varianza de pandas para una sola columna en el marco de datos

En este caso, determinaremos la varianza de una sola columna de DataFrame. El "DF" consta de las cuatro columnas "Nombre", "Edad", "Datos faltantes" y el "Ingreso". Los nombres son "voluntad", "tina", "lirio", "mar" y "swany" sus edades son "33", "45", "35", "85" y "78". Los datos que faltan las edades tienen los valores como "30", "40", "60", "80" y el término faltante como "ninguno" sus ingresos son como "99000", "88000", "77000", "55000" y "68000". Dado que calcularemos una varianza de una sola columna, tenemos que especificar un nombre de columna con la varianza, por ejemplo, "ingreso_varience"; Aquí, la columna "Ingresos" se selecciona para el cálculo de la varianza. La función var () con el "DF" y la columna de ingresos especificada.

La salida muestra la varianza calculada de la columna "Ingresos" utilizando la función Pandas var ().

Ejemplo # 02: Cálculo de varianza de pandas de una sola columna en el marco de datos usando DDOF

Aquí usaremos el argumento DDOF para el cálculo de la varianza en una sola columna. En el marco de datos, el marco de datos consiste en los nombres "Shein", "Rose", "Allen", "Wilson" y "Dom" las edades como "44", "23", "55", "36" y "41". El ingreso como "39000", "8400", "57000", "54000" y "55000" y que tiene la columna de datos de edades faltantes como "20", "22", "23", "25" y "ninguno ". La pregunta comienza con el uso del argumento que cambia a "0". La respuesta es que el valor predeterminado de los pandas se configura como N-1 como el "denominador", y si queremos usar la "n" como el denominador, por lo que tenemos que usar el argumento "DDOF" y cambiar su valor a " 0 "en lugar de" 1 ".

El "de" es la abreviatura del "Delta Grado de libertad", funciona como el divisor utilizado en el cálculo como "n", donde representa el número de elementos. Aquí también, la columna se puede elegir mediante la elección suya según el trabajo necesario, podemos calcular la varianza de cualquiera de las columnas que consisten en valores numéricos. La columna "Ingresos" se selecciona aquí también para calcular la varianza.

La pantalla muestra la varianza calculada del ingreso de la columna como "212560000" utilizando el argumento DDOF establecido en "0":

Ejemplo # 03: Varianza de PANDAS para el cálculo de las múltiples columnas en DataFrame

En el primer ejemplo, hemos hecho el ejemplo de cómo calcular la varianza en los pandas de la columna única en el marco de datos. Ahora, calcularemos la varianza en múltiples columnas utilizando la función Pandas var (). DataFrame consiste en nombres como "Nina", "Ruby", "Ali", "Peter" y "Lisa", con las edades "55", "85", "45", "31" y "51". Los datos de valor faltantes de las edades tienen los valores como "21", "32", "20", "36" y el término faltante. Tenemos los ingresos de esas personas como "70000", "47000", "62000", "45000" y "56000".

Hemos elegido las columnas "edades" y el "ingreso" de la columna para el cálculo de la varianza en los pandas. Podemos decidir las columnas e ingresarlas para calcular la varianza de acuerdo con el rendimiento de análisis posterior.

El resultado consiste en la varianza calculada de las "edades" y la columna de "ingresos" que se eligió, respectivamente. Podemos ver que la varianza de diferentes columnas se muestra por separado con los nombres de sus columnas.

Ejemplo # 04: Varianza de PANDAS para el cálculo de las columnas completas completas

En este ejemplo, implementaremos la función pandas var () para el cálculo de la varianza en todo el marco de datos. Los datos aquí contienen los nombres "Fiona", "Zayn", "Steeve", "Henry" y "Olive" sus edades son "18", "25", "35", "36" y "56". La columna de falta de edad tiene los valores "14", "12", "30", "16" y "Ninguno". Sus ingresos son "80000", "38000", "33000", "95000" y "78000".

La sintaxis básica se usa para cada columna del cálculo de la varianza del marco de datos; DataFrame seleccionó toda la columna con la función "var ()". La instrucción Varianza de impresión imprimirá todas las variaciones calculadas.

La salida muestra los cálculos de varianza de las columnas del marco de datos, que estaban en valores numéricos. Tales como "edades", "edades faltantes" y la columna de "ingresos". La columna de nombre tiene los caracteres, por lo que su varianza no se puede calcular.

Conclusión

La varianza de los pandas es una función muy útil pero muy técnica. Ayuda a calcular la varianza muy fácilmente usando la función var () de pandas. En este artículo, hemos aprendido todos los métodos con ejecución de ejemplo de cada uno para una mejor comprensión. Hemos realizado el cálculo de varianza de una sola columna en los pandas, los cálculos de varianza de columna múltiple en los pandas, el que cambia el argumento desde la configuración predeterminada y también la aplicación de cálculo de varianza en el cuadro de datos completo. Cada uno de ellos es muy útil por sí solo, dependiendo del uso y la condición por la necesidad de tiempo.