Desviación estándar de pandas

Desviación estándar de pandas

"El" Pandas "es un gran lenguaje para realizar el análisis de datos debido a su gran ecosistema de paquetes de Python centrados en datos. Eso facilita el análisis e importación de ambos factores. La desviación estándar es una desviación "típica" derivada de la media. Se usa mucho, ya que devuelve las unidades originales de medida del marco de datos. Los pandas usaron std () para el cálculo de la desviación estándar. La desviación estándar se puede calcular a partir de los valores dados que pueden estar en el marco de datos en forma de fila o columna. Implementaremos todas las formas posibles en las que se usa la desviación estándar de los pandas. Para la implementación del código, utilizaremos la herramienta "Spyder", ya que está escrita en un entorno amigable para Python."

Sintaxis

"DF.std () "


La siguiente sintaxis se usa para calcular la desviación estándar en el marco de datos. El "DF" en DataFrame es la abreviatura de "DataFrame". ¿Qué hace la desviación estándar?? Mide qué tan extendidos son los datos requeridos. Cuanto más expandidos valores altos, mayor será la desviación estándar.

Devolver

La desviación estándar de pandas devuelve el marco de datos si el nivel se especifica en función del requisito.

Tenga en cuenta que la función "std ()" ignorará automáticamente los valores "nan" en el "DF" al calcular la desviación estándar de los pandas. "Nan" puede explicarse como "no un número", lo que significa que no hay valor asignado a un particular.

Los siguientes son los métodos que se ejecutarán con ejemplos de la desviación estándar PANDAS:

    • Cálculo de desviación estándar de Pandas en una sola columna.
    • Cálculo de desviación estándar de Pandas en múltiples columnas.
    • PANDAS Cálculo de desviación estándar de todas las columnas numéricas.
    • desviación estándar de pandas usando el eje = 1.
    • desviación estándar de pandas usando el eje = 0.

Creación de DataFrame para el cálculo de la desviación estándar en los pandas

Primero, abra el software "Spyder". Ahora importe la biblioteca de Pandas como PD. Crearemos un marco de datos que consiste en un marcador que tiene términos como "X", "Y" y "Z" con sus puntos como "22", "10", "11", "16", "12", "45 "," 36 "y" 40 ". Tenemos sus valores de asistencias como "8", "9", "13", "7", "22", "24", "4" y "6" también, teniendo el valor de los rebotes como "17", ",", 14 "," 3 ", 5", "9", "8", "7" y "4".


Las pantallas muestran el marco de datos creado de acuerdo con los valores asignados en el código:

Ejemplo # 01: Cálculo de desviación estándar de Pandas en una sola columna

En este ejemplo, calcularemos la desviación estándar de una sola columna en el marco de datos PANDAS. DataFrame tiene los valores del equipo como "U", "V" y "B" con sus puntos como "44", "33", "22", "44", "45", "88", "96 "Y" 78 ". Los valores de los asistencias son como "7", "8", "9", "10", "11", "14", "18" y "17" también tienen los valores de los rebotes como "11", ",", 9 "," 8 "," 7 "," 6 "," 5 "," 4 "y" 3 ". La columna "Puntos" se selecciona de DataFrame para calcular la desviación estándar de una sola columna.


La salida muestra la desviación estándar calculada de la columna "puntos":

Ejemplo # 02: Cálculo de desviación estándar de Pandas en múltiples columnas

En este ejemplo, ejecutaremos los cálculos de desviación estándar de Pandas en múltiples columnas. En este marco de datos, los datos son nuevamente del marcador deportivo que tiene los valores del equipo como "n", "w" y "t" con el puntaje como "33", "22", "66", "55", "44", "88", "99" y "77". Las asistencias como "9", "7", "8", "11", "16", "14", "12" y "13" y rebotes como "5", "8", "1", " 2 "," 3 "," 4 "," 6 "y" 7 ". Aquí calcularemos la desviación estándar de las dos columnas "puntos" y "rebotes" utilizando la función std () aplicada a DataFrame.


Como vemos, la salida muestra que la desviación estándar surgió como 26.944387 en la columna de puntos y 2.449490 en la columna de rebote, respectivamente.

Ejemplo # 03: Cálculo de desviación estándar de Pandas de todas las columnas numéricas

Ahora hemos aprendido a calcular la desviación estándar de filas individuales y múltiples. ¿Qué pasa si no queremos especificar todos los nombres de la columna en DataFrame y calcular todo el marco de datos?? Esto es posible con solo una implementación de función simple de la desviación estándar PANDAS para el cálculo del marco de datos completo por completo en los resultados. El marco de datos aquí consiste en "L", "M" y "O" con los valores de puntuación "33", "36", "79", "78", "58", "55" y dos equipos obtienen la misma manera de la misma eso es "25". Las asistencias son como "1", "2", "3", "4", "6", "9", "5" y "7" y sus rebotes como "14", "10", "2" , "5", "8", "3", "6" y "9". Podemos calcular todas las desviaciones de la columna estándar por PANDAS en el marco de datos utilizando la función Pandas "STD ()".


La pantalla tiene la desviación estándar calculada de todo el "DF" que se muestra a continuación; También podemos notar que los pandas no han calculado la desviación estándar de la primera columna, que es "equipo", porque no es una columna numérica.

Ejemplo # 04: desviación estándar de pandas usando el eje = 0

En este ejemplo, los marcos de datos tienen los equipos de los deportes como "G", "H" y "K" con datos adicionales. Aquí, calcularemos la desviación estándar utilizando el eje como "0", un parámetro utilizado en la desviación estándar de Pandas. Este argumento calcula la columna de desviación estándar del marco de datos.


La siguiente salida muestra los resultados en columnas de la desviación estándar calculada. La columna de puntos tiene la desviación estándar calculada como "24.0313062 ", la columna de asistencia tiene la desviación estándar calculada como" 2.669270 "y la desviación estándar calculada de la columna de rebote se muestra como" 3.943802 ".

Ejemplo # 05: desviación estándar de pandas usando el eje = 1

Aquí usaremos el parámetro del eje asignado como "1" para calcular la desviación estándar en pandas. ¿Qué diferencia puede hacer el eje "1"?? El argumento del eje "1" calcula la desviación estándar de la fila de los valores numéricos en el marco de datos. DataFrame tiene los tres equipos como "S", "D" y "E", con la adición de columnas de datos creadas como puntos del equipo, asistencias del equipo y rebotes del equipo. Las instrucciones se asignan con diferentes valores en DataFrame. Este parámetro del eje es un cambio de juego que, para el momento, necesitamos trabajar en los datos donde queremos que esté en un punto de columna más calculado de desviación estándar realizada.


La siguiente salida muestra la desviación estándar calculada en una fila de DataFrame:

Conclusión

La desviación estándar de Pandas es una función muy técnica, que es una función muy beneficiosa, ya que encuentra la desviación estándar del pacto de entusiasmo de Pandas Dataframes. En este editorial, hemos estudiado los métodos para calcular la desviación estándar en los pandas. Hemos realizado cálculos de una sola columna de desviación estándar y múltiples columnas y también calculamos la desviación estándar de todo el marco de datos juntos. Todas las estrategias funcionan bien siempre que se usen de manera consistente y con los resultados deseados.