Pivote Pandas DataFrame

Pivote Pandas DataFrame
Pandas es la biblioteca de Python. Utilizamos pandas para muchos propósitos. Podemos hacer el marco de datos en pandas y pivote que dio dataFrame. Para privar o remodelar el DataFrame, el PANDAS proporciona el método "Pivot ()". Se puede reorganizar un marco de datos especificado utilizando el método "pivot ()" a través del índice y los valores de columna especificados. Cuando queremos remodelar el marco de datos, utilizamos el método "pivot ()". Cuando utilizamos el método "pivot ()", debe usar el valor de índice único. La agregación de datos no es compatible con el método "pivot ()"; múltiples valores producen un multiíndex en las columnas. En esta guía, exploramos el método "pivot ()" en pandas en detalle. Y le daremos una demostración visual de los códigos donde remodelamos el marco de datos usando "Pivot ()".

Sintaxis:

Marco de datos.Pivot (self, index = none, columns = none, valores = ninguno)

Ejemplo 1:

Mostraremos el ejemplo práctico del método "pivot ()" en pandas. Hacemos el código Pandas en la aplicación "Spyder". Como sabemos, necesitamos importar algunas funciones de pandas como "PD". Desarrollamos este código, por lo que aplicamos el método "pivot ()". Este método se aplica a DataFrame. Primero creamos el marco de datos aquí. El marco de datos que desarrollamos aquí se llama "cars_data" donde agregamos los datos relacionados con los automóviles. Hacemos la primera columna con el nombre "Car_name" donde agregamos algunos nombres de autos como "Wagonr, Swift, Lexus, Mehran, Mustang, Alto y Jaguar".

También insertamos más columnas que se denominan "Car_model, Car_no y Challan". Los datos en esas columnas también se insertan aquí. La columna "Car_model" contiene los números de modelo de los automóviles que son "2014, 2001, 2010, 2015, 2020, 2012 y 2019". La columna "Car_no" contiene "R123, R456, R162, R102, S127, W190 y Z345". Luego, tenemos la columna "Challan" donde agregamos los valores "500, 4000, 500, 6000, 2000, 1000 y 2000". Este es el cuadro de datos completo que contiene cuatro columnas. Después de esto, establecemos los valores de índice para las filas que son "R1, R2, R3, R4, R5, R6 y R7". Insertamos estos valores de índice en el "CARS_DATA" utilizando el método "Índice".

Luego, lo colocamos en el método "print ()" para renderizar en la consola. No remodelamos el marco de datos ni aplicamos el método "pivot ()" todavía. Simplemente mostramos el marco de datos "cars_data".

Presionamos el "Shift+ Enter" para ejecutar este código. Después de presionar esas teclas, obtenemos el resultado dado del código que muestra el marco de datos que desarrollamos en el código PANDAS. Ahora, aplicamos el método "pivot ()" a este marco de datos y remodelamos de acuerdo con nuestra elección.

Aquí, agregamos estas líneas a nuestro código pandas y utilizamos el método "pivot ()". Este método "Pivot ()" contiene tres parámetros. En el primer parámetro, establecemos el nuevo índice, que es el "car_model". El segundo parámetro es el nombre de la columna que establecemos aquí como "Challan". Y el tercer parámetro es el parámetro de valor que nosotros como "car_name". Ahora, el marco de datos "cars_data" se remodera y aparece como definimos. La columna "CAR_MODEL" aparece como el índice, la columna "Challan" aparece como los nombres de la columna y los valores del marco de datos son el "CAR_NAME".

Aquí, aparece el marco de datos remodelado y todos los ajustes de valores aparecen en consecuencia que definimos en el código. El índice en este marco de datos remodelado es el "CAR_MODEL". El nombre de la columna aquí es la columna "Challan". Todos los "car_name" se ajustan aquí como los valores. El "nan" aparece aquí en la celda vacía.

Ejemplo 2:

DataFrame que desarrollamos en este ejemplo es el "new_interview_df". Pero primero creamos una lista anidada con el nombre "new_interview". Y luego, convertimos esta lista anidada en el marco de datos. La lista "New_interview" contiene el "Pro_language" donde tenemos el "Java, C#, Python, Oop y Python". Tiene "Code_Office" donde colocamos el "Bar12, Lon34, PAR33, LON56, Bar53, Lon11 y Bar34". A continuación, tenemos el "Emp_Salary" e insertamos el "18000, 25000, 20000, 15000, 34000, 22000, 31000 y 43000". El "new_interview" se transforma en el "new_interview_df" con la ayuda del "PD.Método DataFrame ”. También colocamos el método "new_interview_df" en el método "print ()". Aparece en la consola después de la ejecución.

Ahora, remodelamos el "new_interview_df" con la ayuda del método "pivot ()". Esta vez, mencionamos los "valores, índice y la columna" dentro del método "pivot ()". Aquí, establecemos el "Emp_salary" como valores, "Code_Office" como el índice y "Pro_language" como las columnas. Luego, imprimemos este marco de datos remodelado.

El original, así como los marcos de datos remodelados, aparecen aquí. Puede notar que el valor, el índice y los nombres de columna se cambian y un nuevo DataFrame remodelado aparece debajo del marco de datos original. En el marcado de datos remodelado que apareció aquí, el índice es el "Code_Office", los nombres de la columna son "pro_language" y los valores son el "empitador".

Ejemplo 3:

Nuevamente creamos otra lista para este ejemplo. Esta lista se llama "temp_list" que tiene "mes, ciudad, temperatura y humedad". El "mes" que insertamos aquí es "enero, mayo, junio, febrero y julio". La "ciudad" tiene "Nueva York, Birmingham, Mumbai, Baljiam y Bangalore". En la "temperatura" y la "humedad", agregamos el "62, 68, 70, 77, 69" y "60, 66, 69, 74, 63", respectivamente. Luego, cambiamos el "Temp_List" en el DataFrame de datos "TEMP_DF". Luego representamos este "temp_df" aquí.

Ahora, queremos pivotar o remodelar este "temp_df". El método "Pivot ()" aquí ayuda a hacerlo. Establecimos el "mes" como su índice y la "ciudad" como nombre de columna. Los valores que establecemos aquí son tanto "temperatura" como "humedad". Aparecen como dos marcos de datos separados con diferentes valores.

Este resultado muestra que después de la remodelación, hay dos marcos de datos separados por puntos. El primer cuadro de datos contiene los valores de "temperatura" y el segundo marco de datos contiene los valores de "humedad". Los índices y los nombres de columna para ambos marcos de datos son los mismos. El índice para ambos marcos de datos es el "mes" y las "columnas" para ambos es "ciudad".

Ejemplo 4:

Este código contiene un marco de datos "DF" donde colocamos "A01" como la primera columna y agregamos "James, James y Mina". La segunda columna es "A02" que tiene "ingeniero, ingeniero y maestro". La tercera columna se llama "A03" donde ponemos "44, 63, 21". Imprimimos el "DF" y aplicamos el "Pivot" aquí. El "A01" es el índice, "A02" es la columna y "A03" es el valor. Ahora, verifique la salida de lo que sucede con este DataFrame.

Aquí está el resultado de este código. Puede notar que el mensaje de error aparece en la salida que dice que el índice contiene las entradas duplicadas. Significa que no establecemos esas columnas como un índice que contiene las entradas duplicadas porque los índices son valores únicos. Por lo tanto, tenga cuidado con eso mientras gira cualquier marco de datos.

Conclusión

El objetivo de esta guía es hacer que la lógica de la función "Pandas Pivot ()" sea más comprensible para usted. Describimos este concepto con gran profundidad para que le resulte fácil aplicar la función "Pivot ()" en el código PANDAS. Explicamos el método "pivot ()". Utilizamos este método para remodelar o pivotar el marco de datos en pandas. También explicamos su sintaxis aquí. En esta guía, observamos cuatro ejemplos descriptivos y prácticos, mirando cuidadosamente cada línea de código. Proporcionamos el resultado para cada código aquí junto con los scripts.