El promedio ponderado es el promedio de los datos que identifican los números específicos que son más importantes que los otros números en el marco de datos. Implementaremos todas las formas posibles en las que se puede calcular el promedio ponderado de Pandas con la ayuda de varios ejemplos.
Fórmula
(valores_column*pesos_column).sum ()/pesas_column.suma()Aquí, Values_Column es la columna numérica en el marco de datos de Pandas que almacena los valores, y pesos_column es la columna numérica que almacenará el peso de cada valor.
Método 1: Promedio ponderado de retorno
Usemos la función personalizada que calcula el promedio ponderado del marco de datos de Pandas. Usaremos la función suma () para calcular la suma en el siguiente cálculo:
Sum (dataFrame_Object [weight_data]*dataFrame_Object [value_data])/dataFrame_Object [weight_data].suma()Aquí, Weight_Data es la columna en el marco de datos que contiene pesos para los valores en la columna Value_Data.
Ejemplo
En este ejemplo, tenemos un marco de datos llamado 'cálculos' con 2 columnas de tipo entero. Ahora, crearemos una función personalizada, 'PESUDED_AVG_CALCULACION', para calcular el promedio ponderado y llamar a la función con estas dos columnas pasándolas como argumentos.
importación de pandasProducción
Cuenta de cantidadExplicación
Entonces, la función personalizada es:
Devolverá el promedio ponderado.
Entonces, el promedio ponderado del marco de datos anterior es 2.92.
Método 2: Promedio ponderado de retorno en grupos
Ahora, usaremos la función GroupBy () para agrupar las filas y devolver el promedio ponderado en cada grupo. El método Apply () se usa junto con el grupo () que toma el promedio ponderado y las columnas como parámetros.
DataFrame_Object.Groupby ('Grouping_Column').Aplicar (Pesoned_Avg_Calculation, 'Value_Data', 'Weight_Data')Aquí, las filas se agruparon en función de los valores en 'Grouping_Column'. El PESUDED_AVG_CALCULME es una función personalizada que calcula el promedio ponderado. El weight_data es la columna en DataFrame que contiene pesos para los valores en la columna Value_Data.
Ejemplo
En este ejemplo, tenemos un marco de datos llamado 'cálculos' con 3 columnas. Ahora, crearemos una función personalizada, 'PESUDED_AVG_CALCULATION', para calcular el promedio ponderado y llamar a la función con las dos columnas pasándolas como argumentos. Agruparemos las filas en función de la columna de 'ítem' y devolveremos el promedio ponderado en cada grupo.
importación de pandasProducción
CUENTA CANTIDADExplicación
Entonces, la función personalizada es:
Devolverá el promedio ponderado.
Hay tres grupos en los cálculos DataFrame.
Método 3: Volver promedio ponderado con Numpy
El módulo Numpy admite la función promedio () en la que podemos pasar los valores y los pesos y obtener el promedio ponderado del marco de datos de Pandas.
numpy.promedio (dataFrame_Object ['value_data'], pesos = dataFrame_Object ['weight_data'])
Ejemplo
En este ejemplo, tenemos un marco de datos llamado 'cálculos' con 2 columnas. Usaremos directamente numpy.promedio () para calcular el promedio ponderado.
importación de pandasProducción:
Cuenta de cantidadExplicación
Aquí, la columna de cantidad será el valor, y el recuento será los pesos.
El promedio ponderado es 273.77.
Conclusión
El promedio ponderado de Pandas es una función valiosa y técnica. Hemos realizado la función personalizada del promedio ponderado de pandas y el promedio ponderado de pandas numpy. El promedio es algo que necesitamos calcular en casi todo, incluso los presupuestos de pequeñas comestibles. Por lo tanto, cuando se habla de los millones de datos, la función promedio de pandas ponderada es un placer para todos los usuarios que trabajan en los cálculos promedio de datos específicos en sus campos.