Pandas medias geométricas

Pandas medias geométricas
Trabajar con el lenguaje de programación de Python hace que todo sea simple y fácil. El lenguaje de programación de Python fue diseñado para facilitar la vida del desarrollador, por lo que incluso los desarrolladores de novatos y principiantes de Python se enamoran de la programación y el desarrollo. Es uno de los mejores lenguajes de programación para el análisis de datos. Además, el lenguaje de programación de Python proporciona bibliotecas que pueden realizar un cálculo matemático y estadístico.

Los medios geométricos es una de las funciones de Python Pandas que se utiliza para calcular la media geométrica de un conjunto dado de números, lista o marco de datos. Este artículo está diseñado para demostrar cómo encontrar la media geométrica usando pandas en Python.

¿Qué significa geométrico??

La media geométrica es el promedio del conjunto de números que generalmente se conoce como una tasa de crecimiento anual compuesta. Se usa donde una lista de números debe multiplicarse juntos. En palabras simples, es el valor promedio del conjunto de números. Para calcular la media geométrica, simplemente multiplicamos todos los números presentes en el conjunto y tomamos su enésima raíz, donde n es el número total de observaciones presentes en el conjunto.

Cómo encontrar la media geométrica usando pandas en Python?

Hay varias formas que podemos implementar para calcular los medios geométricos usando pandas en Python. Sin embargo, aquí vamos a discutir las cuatro formas más simples y fáciles de encontrar la media geométrica usando pandas en Python.

Método 1: Cálculo manual de la media geométrica

El primer método es muy simple pero tedioso. Es como calcular la media geométrica en una calculadora, tomar el producto de todos los números y luego tomar la enésima raíz del producto. Ahora veamos un código de ejemplo para aprender el método manual.

Ejemplo 1

En este ejemplo, simplemente proporcionaremos 5 números y tomaremos su producto con * (signo de multiplicación), y luego dividiremos el producto por 5 como 5 es el número de observaciones. Ahora veamos el código:

Números = 10 * 20 * 1 * 5 * 6
n = 5
gm = (números) ** (1/n)
Imprimir ('La media geométrica calculada manualmente es:' + Str (GM))

Tenga en cuenta que el producto de 10 * 20 * 1 * 5 * 6 es 6000, y la enésima raíz de 6000 es 5.69. Vea la salida a continuación:

Método 2: usando un bucle para calcular la media geométrica

El método alternativo del proceso manual es proporcionar todos los números en una lista y usar el bucle para calcular el producto. Vea el ejemplo a continuación para comprender mejor.

Ejemplo 2

En este ejemplo, simplemente pondremos todos los números en una lista y usaremos el bucle 'para' para calcular el producto de los números proporcionados en la lista y aplicaremos la fórmula de medios geométricos. Vea el código a continuación.

producto = 1
Números = [10, 20, 1, 5, 6]
n = len (números)
para i en números:
producto = (producto)*(i)
GM = (producto) ** (1/n)
Imprimir ('La media geométrica calculada manualmente es:' + Str (GM))

Después de usar el bucle 'for', obtendrá el siguiente resultado. Ahora, si se da cuenta, el resultado es el mismo que en el ejemplo anterior. Pasemos al tercer método.

Método 3: Use Scipy y Pandas para calcular las medias geométricas

La Biblioteca Pandas en Python es excepcionalmente excelente con el cálculo estadístico y matemático. Proporciona casi todas las funciones para cálculos científicos, estadísticos y matemáticos. Los pandas proporcionan una función gmean () para encontrar la media geométrica de un conjunto de números. En el siguiente ejemplo, demostraremos cómo usar la función gmean () para calcular los medios geométricos usando scipy y pandas.

Ejemplo 3

Este ejemplo es muy simple; Simplemente importaremos la biblioteca de 'estadísticas' de scipy y usaremos la función gmean () en un conjunto de números. Vea el código a continuación:

De las estadísticas de importación escasas
GM = estadísticas.Gmean ([10, 20, 1, 5, 6])
Imprimir ('La media geométrica calculada manualmente es:' + Str (GM))

Como hemos usado el mismo conjunto de números, la salida debe ser la misma que en los ejemplos anteriores. Vea la salida a continuación.

Tenga en cuenta que la función gmean () proporcionó el mismo resultado que en los ejemplos anteriores, lo que significa que gmean () es capaz de realizar el cálculo de un par de líneas de código con solo la llamada de función gmean ().

Ahora creemos un marcado de datos y luego usemos Scipy y Pandas en él para ver cómo se comporta gmean () con DataFrames. Primero, crearemos un marcador de datos y luego llamaremos a la función gmean () para calcular la media geométrica de un marco de datos. Vea el código a continuación:

Desde Pandas Import DataFrame
De Scipy.estadísticas.mstats import gmean
list1 = 'números': [10, 20, 1, 5, 6]
df = dataFrame (list1)
GM = Gmean (DF.loc [:, 'números'])
Imprimir ('La media geométrica calculada manualmente es:' + Str (GM))

Vea la salida a continuación. Tenga en cuenta que, como antes, se genera el mismo resultado. Ahora, pasemos al cuarto y último método.

Método 4: Use Numpy para calcular la media geométrica

Este método se trata de calcular la media geométrica utilizando la función incorporada proporcionada por la biblioteca Numpy. Vea el ejemplo a continuación para aprender a usar la función incorporada Numpy en el código de Python.

Ejemplo 4

En este ejemplo, simplemente crearemos una función personalizada para calcular la media geométrica usando las funciones Numpy incorporadas log () y Mean (). La función personalizada y la función gmean () están diseñadas para realizar la misma función para que puedan proporcionar el mismo resultado. Vea el siguiente código para aprender cómo definir la función de Python personalizada que puede calcular la media geométrica para usted.

Aquí, utilizaremos la función log () para encontrar el registro del conjunto de los números primero, luego aplicaremos la función media () normal, y después de eso, la función exp () se aplica para convertir la media normal en media geométrica. Vea el código a continuación para tener una mejor comprensión.

importar numpy como np
def g_mean (x):
a = np.log (x)
devolver np.exp (a.significar())
gm = g_mean ([10, 20, 1, 5, 6])
Imprimir ('La media geométrica calculada manualmente es:' + Str (GM))

Como hemos proporcionado los mismos datos que la entrada, la salida debe ser la misma nuevamente. Vea la salida a continuación.

Conclusión

En este artículo, hemos aprendido sobre cómo calcular los medios geométricos en Python. Hemos demostrado cuatro métodos diferentes para calcular la media geométrica en Python. El primer método es manual, el segundo método utiliza el bucle 'para', el tercer método utiliza scipy y pandas, y el último método utiliza la función personalizada numpy para calcular las medias geométricas.