Pandas DataFrame Groupby

Pandas DataFrame Groupby
Para agrupar los datos en categorías y aplicar una función a las categorías, utilizamos el método Pandas "GroupBy ()". La agregación de datos efectiva también es ayudada por ella. La función GroupBy () se utiliza para dividir los datos en grupos en función de algunos criterios específicos. Los objetos de "pandas" se pueden dividir a lo largo de cualquier eje. Podemos decir que en un método "groupby ()", el objeto se divide, se aplica una función y sus resultados se combinan. Los datos grandes se pueden agrupar utilizando el método "GroupBy ()", y las operaciones también se pueden calcular en estos grupos. Esta guía explicará el método "Groupby ()" en detalle y le dará las pautas adecuadas sobre el método "Groupby ()".

Ejemplo # 01:

También implementamos esta función "Groupby ()" en el código "Pandas" en esta guía, por lo que aprenderá más rápidamente sobre la función "Groupby ()". Importamos primero los "Pandas como PD" en la herramienta "Spyder" y luego generamos una lista llamada "Datos" aquí e insertamos algo de información en ella. Pusimos el nombre "equipo" como el encabezado de la columna y los equipos que le agregamos son "Jinetes, jinetes, demonios, demonios, reyes, reyes, reyes, reyes, jinetes, mayales, realistas, jinetes". La próxima columna que creamos aquí es la columna "Año", en la que agregamos datos de año como "2014, 2015, 2014, 2015, 2014, 2015, 2016, 2017, 2016, 2014, 2015, 2014".

Ahora, esta es nuestra lista, y estamos cambiando esta lista de "datos" en el marco de datos. Entonces, para esto, hemos utilizado el "PD.Función DataFrame () ", que convierte esta lista en el DataFrame" Pandas ". El marco de datos creado aquí se almacena en la variable "DF" y la imprimimos colocando el "DF" como el parámetro de "print ()". Ahora, el objetivo principal de escribir este código es implementar el método "GroupBy ()" en estos datos. Utilizamos el método "GroupBy ()" y lo aplicamos a "Año". Esto agrupará los datos en función de los años que hemos insertado. Después de la agrupación, aplica el método "Count ()" a este grupo. Contará los mismos años y luego los almacenará en "DF1". Después de esto, tenemos la "impresión" que lo hará.


Para obtener la salida, simplemente haga clic en el botón "Ejecutar" en la aplicación "Spyder". El marco de datos que contiene equipos y años se presenta primero, y luego agrupa los mismos años, los cuenta y muestra el número de conteo frente a cada grupo de años. A medida que agrupa el año "2014" y muestra "5", lo que significa que el año "2014" aparece cinco veces en este marco de datos. Esta agrupación se realiza porque utilizamos el método "GroupBy ()" en este marco de datos.

Ejemplo # 02:

Después de importar los "Pandas como PD", generamos directamente el marco de datos con el nombre de "Animales" y contiene dos columnas: "Animal" y "Speed ​​máximo". La columna "Animal" tiene "Sparrow, Falcon, Parrot, Parrot, Sparrow y Falcon" en ella. La columna "Máxis de velocidad" contiene "210, 30, 37, 24, 260 y 390". Crea un marco de datos que contiene estas columnas, ya que hemos utilizado el "PD. Método dataFrame () ”aquí.

Luego mostramos este marco de datos "animal". Después de esto, aplicamos el método "GroupBy ()" al marco de datos "Animales" e insertamos la columna "Animal" como parámetro. Esto hará que los grupos dependan de los mismos nombres de animales. Luego también utilizamos la función "media ()" aquí, que encontrará la media de esos grupos que se crean aquí, e inicializamos la variable "grupo" con este método "groupby ()", por lo que el resultado que obtenemos después de agrupar será almacenado en él. También queremos mostrar el resultado que se almacena en "grupo", por lo que para esto, nuevamente utilizamos la función "print ()".


Los animales y sus velocidades máximas se muestran en el primer marco de datos sin agrupar. Después de esto, la función "Groupby ()" se aplica aquí y agrupa a todos los animales del mismo nombre y luego encuentra su media y los muestra a continuación.

Ejemplo # 03:

Estamos creando una nueva lista en este código, que es la lista "Summer_courses", y agregando cuatro columnas únicas. Los nombres de los encabezados de las columnas son "Sujeto, Sub_fee, Days y Dis_amount". También agregamos los nombres de los sujetos, las tarifas de los sujetos, la duración del curso en los días y el monto de descuento en la tarifa en esas columnas. En el "tema" que agregamos aquí se encuentran "Desarrollo web, Wengineering, CSS, HTML, CSS, Desarrollo web, CSS, HTML y también NA". El "Sub_fee" contiene la tarifa que es "22000, 25000, 23000, 24000, 25000, 26000, 25000, 25000, 22000 y 15000". Los días que entramos aquí son "30, 50, 55, 40, 60, 35, 30, 50 y 40", y también la columna "Dis_amount" contiene "1000, 2300, 1000, 1200, 2500, ninguno, 1400, 1400, 1600 y 0 ".

Ahora, tenemos que cambiar esta lista a DataFrame. Entonces, para convertir la lista en DataFrame, utilizamos el "PD.DataFrame () "Función y nombre el DataFrame" Summer_course_DF ". También representamos "Summer_course_DF" aquí. La variable "Summer_course1" se inicializa utilizando la técnica "GroupBy ()" para que los resultados de la agrupación se guarden en ella. El método "groupby ()" se aplica a la columna "sujeto".

Como resultado, se crearán grupos basados ​​en nombres de temas similares. La función "suma ()" se usa para calcular la suma de los grupos sujetos que se acaban de formar. Esta "suma ()" calcula la suma de tarifas, días y montos de descuento para los mismos temas. También queremos mostrar el resultado que se guardó en "Summer_Course1", por lo que una vez más utilizamos la función "Impresión ()".


Aquí, puede notar que hace que todos los sujetos sean por separado en el primer marco de datos. Luego combina los mismos sujetos o hace grupos de los mismos nombres de sujetos y también muestra el mismo nombre de nombre una vez. Aplica la función de suma a las columnas Sub_fee, Days y Dis_amount de los mismos nombres de sujetos y hace sus sumas aquí.

Ejemplo # 04:

En este código, utilizamos el marco de datos del ejemplo anterior, pero aquí estamos realizando la función "GroupBy ()" en varias columnas. Pasamos dos nombres de columnas a la función "Groupby ()", que son "sujeto" y "días". Luego coloque la "Sum ()" que realizará la suma en los grupos que se crean aquí y los guardará en la variable "Summer_Courses2". Después de esto, representamos el "Summer_Courses2" al final.


Este resultado muestra que realiza la función "GroupBy ()" en las columnas "Sujeto" y "Días" y representa el resultado aquí después de agrupar.

Conclusión:

Puede utilizar esta guía para estudiar cómo utilizar la función "GroupBy ()" en "Pandas" y también aprender sobre la sintaxis de este método "Groupby" aquí. Nuestro objetivo principal es darle una explicación concisa y comprensible de la idea del método "Groupby ()" en "Pandas". Hemos explicado que este método nos ayuda a hacer grupos dependiendo de algunos criterios específicos. Hemos hecho cuatro ejemplos en esta guía en la que hacemos grupos utilizando el método "Groupby ()" en "Pandas". Después de leer este tutorial, tendrá un modesto grado de conocimiento, desde el cual puede avanzar a una etapa superior.