Pandas Rolling Media

Pandas Rolling Media

"La funcionalidad de cálculo de la ventana de rodadura es proporcionada por los pandas" DataFrame.laminación().método medio () ". La media de un número específico de intervalos anteriores en una serie de tiempo se conoce como media rodante."

La siguiente sintaxis se puede usar para determinar el promedio de rodamiento para columnas simples o múltiples en un marco de datos PANDAS:

Exploraremos diferentes técnicas para emplear este método en esta lección.

Ejemplo 1

En esta ilustración, utilizaremos los pandas "DF.laminación().Método de la media () "para calcular la media rodante de una sola columna.

Primero tenemos que obtener los requisitos para la compilación del código. Necesitamos un software que nos proporcione un entorno compatible con Python para compilar nuestro script de Python. Hemos instalado la herramienta "Spyder" en nuestro sistema. Después de iniciar la herramienta, podemos acceder a la interfaz.

Comenzando con el programa, inicialmente necesitamos cargar la biblioteca esencial. El método "Rolling ()" en el que se basa nuestro artículo es la función Pandas. Entonces, para usar este método en nuestro programa, tenemos que importar la biblioteca "Pandas" y crear "PD" como alias para "Pandas".

Después de que se haya logrado el requisito previo, tenemos que generar un marco de datos PANDAS utilizando el "PD.Módulo DataFrame () "proporcionado por el Kit de herramientas PANDAS. El "PD.El método DataFrame () "se invoca con 4 columnas que especificamos como" verano "," invierno "," otoño "y" primavera ". Cada columna almacena 8 valores. Los valores identificados para la columna "Summer" son "200", "130", "280", "100", "270", "360", "120" y "311". La columna "Invierno" tiene estos valores "12", "34", "54", "67", "98", "45", "78" y "43". La tercera columna, "Autumn", tiene valores como "12", "13", "42", "32", "71", "61", "77" y "89". Para la columna "Spring", los valores son "10", "29", "78", "44", "76", "55", "32" y "22".

El "PD.DataFrame () ”, cuando se invoca, construye un marco de datos utilizando estos valores proporcionados. Luego necesita un espacio de almacenamiento donde pueda poner este marco de datos para su uso posterior. El recién creado DataFrame ahora es accesible al mencionar el objeto "temporada". El siguiente requisito es mostrar este marco de datos en la pantalla para que podamos verlo correctamente. Para esto, hemos empleado el método "print ()" de Python. Entre sus paréntesis, proporcionamos la entrada que debe mostrarse. Aquí hemos proporcionado el objeto "temporada" como una entrada al método "print ()" para mostrar su contenido.

Para ejecutar el script mencionado anteriormente, tenemos que presionar la opción "Ejecutar archivo"; Alternativamente, también puede presionar las teclas "Shift+Enter" juntas para ejecutar el código. Esto nos da un marco de datos con 4 columnas y 8 filas. La lista de índices comienza desde "0" por defecto y termina en "7".

Ahora ejerceremos el método Pandas "Rolling ()" para calcular el rodamiento estimado de una sola columna en el marco de datos proporcionado. Aprendamos a conseguir esto.

Hemos invocado el "DF.Método Rolling () ". El nombre de DataFrame "temporada" con el ".El método Rolling () "está escrito. Como queremos obtener la ventana rodante para el cálculo de la media rodante de una sola columna, tenemos que especificar el nombre de la columna con el nombre de DataFrame. La columna que hemos elegido aquí es la columna de "verano" del marco de datos "temporada". Entre los soportes redondos del método "Rolling ()", hemos definido el valor "3". Significa que queremos calcular el rodamiento de la columna de "verano".

El ".la función media () "calculará la media para el rodamiento de 3 días del" verano ". Queremos almacenar esta media rodante estimada de la columna "verano" en una nueva columna. Entonces, para crear una nueva columna, escribimos el nombre de DataFrame, el operador de subíndice y luego el nuevo nombre de la columna como "Summer_rolling". Lo asignamos el resultado de "temporada [" verano "].Rolling (3).función media () ". Por lo tanto, la media rodante durante 3 días de los valores de la columna de "verano" se almacenará en la columna "Summer_rolling". Por último, imprima el marco de datos invocando el método "print ()".

En la instantánea producida, podemos ver que las dos primeras entradas que obtenemos son valores nulos. Esto se debe a que no podemos estimar la media rodante, ya que solo se puede calcular cuando tenemos una ventana de 3 días, pero para los dos primeros registros, no tenemos ningún valor anterior para completar las ventanas especificadas; Por lo tanto, se devuelven los valores de NAN. En el 3rd fila, obtenemos un valor "203.3333333 ”, que es el rodaje promedio para los 3 días.

Ejemplo # 2

Hemos aprendido a encontrar el promedio rodante de una columna en un marco de datos de pandas. La media rodante también se puede calcular para múltiples columnas. Para múltiples columnas, tenemos que invocar el método media de rodadura por separado para cada columna.

Ejercitaremos el método de rodadura en el marco de datos generado previamente para estimar la media de rodadura de múltiples columnas. El "DF.laminación().El método medio () "se invoca. Hemos invocado este método dos veces porque queremos calcular el promedio rodante para dos columnas. El primer "Rolling ().El método mediano () "se llama DataFrame y el nombre de la columna como" temporada ['Summer'] "y el valor para los días de rodadura se especifica" 4 ".

Para almacenar la media de rodadura calculada en otra columna, hemos inicializado una columna "Summer_rolling". Esto significa que queremos calcular la media rodante para una ventana de 4 días de la columna "verano" y almacenar el resultado en la columna "Summer_rolling". Luego empleamos los 2Dakota del Norte "DF.laminación().método medio () ". La columna que hemos seleccionado aquí es "otoño", y la ventana rodante se especifica como "4". Para guardar los cálculos, hemos creado una columna "Autumn_rolling" en la "temporada" de DataFrame existente. El método "print ()" mostrará la salida final en la consola Python.

En la pantalla de salida, se puede examinar que se han agregado 2 columnas nuevas al marco de datos. Las columnas "Summer_rolling" y "Autumn_rolling" tienen una media rodante estimada para las columnas "Summer" y "Autumn", respectivamente. Los primeros 3 valores en ambas columnas son NAN porque no tienen suficientes entradas para completar la ventana de 4 días para calcular el promedio rodante. De los 4th Entrada, obtiene su primer valor medio rodante.

Ejemplo # 3

El promedio rodante de las columnas completas en el marco de datos se calcula utilizando los pandas "DF.laminación().Método medio () "como el paso final.

Para calcular el promedio rodante de todas las columnas, no necesitamos mencionar el nombre de ninguna columna específicamente. Hemos invocado el "DF.laminación().Media () "Función simplemente suministrando el nombre de DataFrame como" temporada "y el valor para la ventana rodante como" 5 ". Para preservar el resultado, hemos creado una variable "resultado". La rodadura().El método mediano () "calculará el promedio de rodamiento de la" temporada "de DataFrame tomando una ventana de 5 días y almacenando el resultado en la copia de DataFrame utilizando la variable" Resultado ". Hemos utilizado el método "print ()" de Python para exhibir el nuevo DataFrame.

Esto nos da el marco de datos con una media de rodamiento estimada para una ventana de 5 días.

Conclusión

Calcular la media de rodadura para la ventana especificada en un marco de datos es un enfoque simple. Hemos utilizado los pandas "df.laminación().método medio () "para estimar el promedio rodante en este tutorial. Se han discutido tres estrategias diferentes para encontrar la media rodante en un marco de datos. La primera ilustración se basa en calcular la media rodante de una sola columna, la 2Dakota del Norte El ejemplo da la idea de calcular el promedio rodante para múltiples columnas, y la última instancia pasó brevemente al encontrar la media rodante de todas las columnas presentes en el marco de datos. Todas las técnicas se han implementado prácticamente en la herramienta Spyder.