Mesa pivote de pandas

Jacobo Piña

Python proporciona muchas bibliotecas para hacer diferentes tareas. El "pandas" también es una biblioteca de Python. Utilizamos esta biblioteca para manipular y analizar los datos. Podemos diseñar fácilmente el marco de datos en "Pandas". Además, diseñamos las "tablas de pivote" también utilizando las funciones de "pandas". Una tabla de pivote es una característica de hojas de cálculo que permite diversos arreglos de tablas para diversas perspectivas de datos idénticos. Una técnica interactiva para resumir un gran volumen de datos es la "tabla de pivote". El método "Pivot_table ()" de "Pandas" nos ayuda a diseñar las tablas de pivote utilizando los datos de los marcos de datos. Podemos establecer su índice, columnas y valores dentro del método "Pivot_table ()" de acuerdo con nuestra elección o necesidad. También podemos aplicar funciones de agregación a estas pivot_tables en "pandas". En este tutorial, crearemos la tabla de pivote utilizando el método "pivot_table ()" y explicaremos esta "tabla de pivote" en detalle.

Sintaxis

pandas.pivot_table (dataFrame_Name, valores = valores_names, index = index_names, columns = column_names, aggfunc = 'media')

Primero agregamos el nombre de DataFrame cuyos datos queremos utilizar en la tabla de pivote. Luego, en los valores, agregamos los nombres de esas columnas que queremos ajustar como valores de la tabla de pivote. Después de esto, insertamos los nombres de las columnas del marco de datos que deseamos establecer como el índice de la tabla de pivote. Ahora, en las columnas, establecemos los nombres de columnas que queremos ajustar como los nombres de la columna de la tabla de pivote. Entonces, también podemos agregarle la función de agregación. Ahora, haremos el código "pandas" y mostraremos la creación de la tabla de pivote en nuestros códigos. Veamos los ejemplos a continuación.

Ejemplo 01

Comenzamos este ejemplo colocando la "importación" para importar los módulos de "pandas" en la aplicación "Spyder". Colocamos "Pandas como PD" después de la palabra clave "importar". También importamos otra biblioteca que es la "Numpy" de la misma manera. Colocamos "importar" y luego agregamos el "Numpy como NP", por lo que nos ayudará a acceder a los métodos de la biblioteca "Numpy". Después de importar ambas bibliotecas, avanzamos hacia la creación de DataFrame. DataFrame se denomina "Gastos_DF" y luego usamos el método "Pandas" "PD.DataFrame () ”Por lo tanto, nos ayuda a crear DataFrame.

Los datos que agregamos en el "gasto_df" contienen tres columnas que se denominan "exp_id, gasto_type y dinero". Los datos que agregamos en el "exp_id" son "E1, E2, E3, E4, E5 y E6". Luego, en el "Gasto_Type", colocamos: "Vivienda, entretenimiento, transporte, comida, facturas e impuestos". La última columna es la columna de "dinero" que agregamos: "$ 1500, $ 1200, $ 200, $ 3000, $ 5000 y $ 2000". Ahora, simplemente mostramos este "gasto_df usando" print () ". DataFrame se crea y se muestra. Todavía no usamos el método "Pivot_table ()". Primero, mostraremos este marco de datos. Luego, aplicamos el método "pivot_table ()" también en este ejemplo.

Obtenemos el resultado de este código en la aplicación "Spyder" con la ayuda de las claves "Shift+Enter" o también podemos utilizar el icono "Ejecutar" de esta aplicación. Solo el marco de datos se muestra aquí en el resultado y todos los datos se agregan a este marco de datos. Ahora, aplicaremos el método "pivot_table" para crear la tabla de pivote utilizando los datos de este marco de datos.

Agregamos estas líneas dadas al código anterior. Aquí, puede ver que accedemos al método "Pivot_table ()" de "Pandas" utilizando "PD" con ese método. Después de esto, agregamos el nombre del DataFrame como el primer parámetro. Luego, en los "valores", hemos establecido la columna de "dinero" para que se muestre como los valores en las celdas de la tabla de pivote. En el "índice", establecemos el "exp_id". Entonces, la columna "exp_id" se convertirá en el índice de la tabla de pivote. También ajustamos el "gasto_type" en las "columnas" para que los valores de la columna "gastar_type" aparezcan como los nombres de columnas de la tabla de pivote.

Luego, también aplicamos la función de agregación "AGGFUNC" y la establecemos en "NP. suma ”que agregará valores. La "suma" es la función de la biblioteca "Numpy" que obtenemos al colocar el "NP". Hemos almacenado esta "tabla de pivote" en la variable "tabla" y agregamos esta variable de "tabla" en "imprimir" para mostrar.

Aquí está la mesa de pivote. Tenga en cuenta que los "nombres de la columna" de esta tabla de pivote son los valores de la columna "Gastos_type" del marco de datos. El "índice" de esta tabla de pivote son los valores del "exp_id" de DataFrame que hemos creado anteriormente. Además, los "valores" que se agregan en las celdas de esta tabla de pivote son los valores de la columna de "dinero" del marco de datos.

Ejemplo 02

Nuevamente importamos bibliotecas "pandas" y "numpy" para generar el nuevo código. Crearemos la tabla de pivote después de leer el archivo CSV y convertir los datos del archivo CSV en DataFrame. Luego, use los datos de DataFrame para crear la tabla Pivot. Intentemos cómo hacemos la tabla de pivote utilizando los datos del archivo CSV. Después de importar las bibliotecas, utilizamos el método "Read_csv" de los "pandas". Luego, agregue el nombre del archivo CSV que lee los datos de este archivo CSV y almacene estos datos en forma de DataFrame en la variable "DF".

Luego, imprimimos este "DF". También colocamos el método "Cabeza (8)" con esto, por lo que solo mostrará las primeras filas "8" del marco de datos. Después de esto, usamos el método "Pivot_table ()" en el que insertamos el nombre del DataFrame. Luego, colocamos dos índices para la tabla de pivote que son las columnas "Order_id y unidades" del marco de datos. En los "valores", colocamos las columnas de "cantidad" y "país" del marco de datos para que se agregarán como los valores de la tabla de pivote. En la función de agregación, agregamos el "NP. función de suma ". Esta tabla de pivote se almacena en "Pivot_Result" y también mostramos el "Pivot_Result" usando la "print ()".

DataFrame, así como la tabla de pivote, se representa en este resultado y puede verificar fácilmente los índices y valores de la tabla de pivote. Todos los valores e índices de la tabla pivote se ajustan en consecuencia, ya que hemos establecido en el código.

Ejemplo 03

También podemos crear una tabla de pivote con muchos métodos de agregación. Aquí, diseñamos el marco de datos y luego hemos creado la tabla de pivote siguiendo el mismo método que ya hemos discutido anteriormente. En el método "pivot_table ()", ajustamos "emp_type" como el "índice". El "emp_pay" se establece como los "valores" de esa tabla de pivote y agregamos múltiples funciones de agregación aquí y estos son "suma, media y cuenta". Entonces, todas estas funciones se aplicarán a los valores de la tabla de pivote. Este "pivot_table ()" se guarda en "resultado" e imprimimos el "resultado" también para mostrar la tabla de pivote en el terminal.

El DataFrame y la tabla Pivot se muestran aquí. En la tabla de pivote, puede tener en cuenta que las tres columnas: "suma, media y cuenta", contienen el resultado después de aplicar estas funciones a los datos de la tabla de pivote. Además, tenga en cuenta que escribe los mismos valores una vez en la columna de índice y no duplica ningún valor de índice aquí.

Conclusión

En este tutorial, hemos estudiado la "mesa de pivote" en "Pandas". Hemos discutido qué es una tabla dinámica, por qué utilizamos esta tabla de pivote y cómo crear esta tabla de pivote en "Pandas". Hemos explicado el método que es el método "pivot_table ()" que nos ayuda a crear la "tabla de pivote" en "pandas" utilizando los datos de DataFrame. También hemos utilizado este método "pivot_table ()" en los códigos "pandas" también. Hemos aplicado muchas funciones de agregación en esta "tabla de pivote". También hemos desarrollado la "tabla de pivote" después de leer el archivo CSV en este tutorial.

Pitón

Convertir cadena para configurar python

Para convertir la cadena dada en un conjunto, varios métodos como la función set (), el método add (...

José Luis Villagómez

Pitón

Astype numpy

El método astype () del módulo Numpy se usa para cambiar el tipo de datos de una matriz Numpy en otr...

Daniela Villaseñor

Pitón

Python OS Mkdir

El sistema operativo.El método mkdir () del módulo OS se utiliza para crear un solo directorio, dire...

José Luis Villagómez