Pandas agg

Pandas agg
"Pandas" proporciona la función "agg ()". Usando la función "agg ()", podemos utilizar diferentes funciones. Se realiza en el eje del índice de fila, que se inserta automáticamente en DataFrame. El comportamiento predeterminado de las funciones numpy "agg ()" (media, mediana, prod, suma, std, var), que evalúa el agg () de la matriz aplanada, es distinto de este comportamiento. Podemos agregar datos con la ayuda de Agg (). Esta guía utilizará la función "pandas agg ()" y mostrará el funcionamiento de esta función "agg ()" en "pandas".

Sintaxis

La sintaxis de esta función es:

#marco de datos.AGG (func, eje, args, kwargs)

Ejemplo # 01

Tenemos la aplicación "Spyder" para ejecutar nuestros códigos "Pandas". Al desarrollar el código "pandas", debemos "importar" los métodos "pandas" como el "PD". Este "PD" nos permite acceder a los métodos o funciones de los "pandas" agregando "PD" en lugar de "pandas". Generamos los datos y los almacenamos en "data1". Escribimos "x1" y en "x1". Agregamos "60", "50" y "40". Tenemos "Y1" y agregamos "900", "1212" y "51" en él. También colocamos "Z1". En esto, insertamos "200", "300" y "800". Cambiamos este "Data1" en el "DataFrame" y escribimos "PD" con el "DataFrame" para que nos admitirá acceder a esta función de "Pandas".

Pasamos "Data1" como el parámetro del "PD.Marco de datos ()". Genera "DataFrame" para nosotros y también usa la variable aquí "DFA" que almacena este DataFrame en él. Luego agregamos "Imprimir (DFA)" para renderizar esto. A continuación, utilizamos la función "agg ()" para realizar algunas operaciones en este marco de datos. Estamos aplicando "suma" en esta función "agg ()". El resultado que obtenemos después de que la suma se almacena en la variable "ANS". También imprimimos esta suma colocando el "print ()".

También pegamos la salida aquí. Esta salida se extrae en el terminal "Spyder" presionando "Shift+Enter". Primero muestra los datos a medida que se inserta en el código y agrega los valores de "x1", luego se muestra en el siguiente "x1". También se agregan los valores del "Y1" y el resultado se muestra en la columna "Y1". Por último, la operación de suma también se realiza en los valores del "Z1". El resultado después de la suma se representa en la columna "Z1".

Ejemplo # 02

Producimos el marco de datos después de importar los "pandas" como el "PD". DataFrame se llama "datos". Primero insertamos tres filas y agregamos "9, 8, 7" a la primera fila; "4, 5, 6" a la segunda fila; y también "1, 2, 3" a la tercera fila. Luego, insertamos el nombre del encabezado en cada columna utilizando la palabra clave "columnas". Asignamos "A1" como encabezado de la primera columna. "A2" como el encabezado de la segunda columna. Y "A3" para la tercera columna. Imprimimos los "datos" en el terminal de la aplicación Spyder.

Ponemos el nombre del DataFrame "Datos" y utilizamos el método "Agg ()" con estos "datos". Tenemos dos funciones que queremos aplicar al marco de datos: "suma" y "min". La "suma" agregará los números de cada columna por separado. "Min" encontrará el valor mínimo de la columna. Luego, almacenará la suma y el valor min en el "resultado" que hemos creado. Finalmente, imprimirá el "resultado" ya que hemos insertado la "impresión" también.

La suma de la columna "A1" es "14" y el valor mínimo de esta columna es "1". La suma de la segunda columna "A2" es "15". Su valor mínimo es "2". La suma de la última columna "A3" es "16" y el valor mínimo que tenemos para esta columna es "3" que se muestra.

Ejemplo # 03

Repetimos la primera línea en este ejemplo y construimos la "información" de DataFrame. Luego, coloque datos en filas como "3, 8, 7" se inserta aquí en la primera fila. "4, 1, 6" y "7, 2,3" se insertan a la segunda y tercera filas respectivamente. También asignamos algunos nombres de índice a todas las columnas como "Col1", "Col2" y "Col3" para la primera, segunda y tercera columna respectivamente. Presentamos esta "información" usando "Imprimir". Estamos aplicando diferentes agregaciones a las columnas.

En el método "agg ()", mencionamos el nombre de la columna y luego colocamos la operación que queremos aplicar a esa columna mencionada. En cuanto a "COL1", usamos las operaciones "suma" y "min". En el "Col2", aplicamos operaciones "Min" y "Max". Pero no mencionamos el "Col3", por lo que no se aplica ninguna función AGG al "COL3". También usamos la variable "final" para almacenar este resultado y luego renderizarla.

La "suma" y el "min" se aplican al "col1", pero en "max" imprime "nan" porque no aplicamos el "máximo" a este "col1". Luego, los valores "min" y "máximo" de "col2" están aquí, pero el bloque de suma contiene "nan", ya que solo aplicamos "max" y "min" a este "col2". El "COL3" no está aquí porque no aplicamos ningún método "Agg ()" a este "Col3".

Ejemplo # 04

Estamos aplicando diferentes funciones en las columnas y también actualizamos el nombre del índice después del resultado. Para esto, creamos el DataFrame "Datos sin procesar" y tenemos tres filas que contienen algunos números que son "22, 82, 27" en la primera fila; "14, 23, 36" aquí en la segunda fila; y "77, 29, 34" está en la tercera fila. Los nombres de las columnas que agregamos son "data1", "data2" y "data2". A continuación tenemos el método "print ()".

Ahora, utilizamos el método "agg ()" de los "pandas" y establecemos "x" que se utiliza para cambiar el nombre del nombre del índice de fila después de aplicar la función de agregación a la columna "data1". Aplicamos la función "Máx" a "Data1". Seleccionamos "Y" para reemplazar el nombre del índice de fila después de ejecutar la función de agregación. A "data2", empleamos la función "min". En "data3", colocamos la función "media" y establecemos el nombre del índice de fila en "z" que se reemplaza después de aplicar la función de agregación. Luego, también tenemos la "impresión ()" para que el "cálculo" se mostrará para nosotros.

En "Data1" solo se aplica la función "Máx" y los dos valores restantes son "Nan". Además, el valor del índice se cambia a "x". La columna "Data2" solo muestra el resultado para la función "min" y los valores restantes son "nan" y su nombre de la fila de índice es "y" para esto. Ahora, la única media se aplica a "data3" y su índice de fila se cambia a "z".

Conclusión

Esta guía está en la función "AGG" en "Pandas". Hemos explicado que la función "AGG" que se usa en pandas para aplicar diferentes funciones. Hemos establecido cuatro instancias, a los que hemos aplicado el método "AGG".

.