Pandas AGG Count

Pandas AGG Count
En "Pandas" podemos crear los marcos de datos que contienen las filas_and_columns. Grandes cantidades de datos tabulares generalmente se exploran y organizan utilizando el programa PANDAS. "Pandas" nos proporciona varios métodos y uno de ellos es el "recuento", podemos ver cuántos valores hay para cada columna en su marco de datos utilizando el método de recuento.

El método de recuento se utiliza para ubicar columnas incompletas. A partir de ahí, puede elegir si se omitir las columnas en sus procesos o, si es necesario, darles valores predeterminados. En esta guía, examinaremos el recuento de pandas y los valores, que son dos formas de evaluar su marco de datos.

Ejemplo # 01

Comenzamos utilizando la aplicación "Spyder". Esto nos ayudará a hacer los códigos "pandas". En su editor de texto, comenzamos nuestro primer código importando el "Pandas como PD". Este "PD" se utiliza para acceder a los métodos "Pandas" que queremos. Ahora, no necesitamos escribir el nombre completo "Pandas" para acceder a su función. En cambio, solo escribimos "PD".

Luego creamos una variable y también la inicializamos agregando algunos datos. Agregamos los datos en la columna estableciendo el primer nombre de la columna como "nombres" y los nombres que agregamos aquí son "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" y "Rick". La siguiente columna se llama "asignaturas" que contiene nombres de materias como "matemáticas", "economía", "ciencia", "matemáticas", "estadísticas", "estadísticas", "estadísticas" y "computadora".

Debajo de la variable, creamos "número" y utilizamos el "PD.Método DataFrame () ". Utilizamos el "PD" para obtener el método PANDAS "DataFrame". Cambiamos los datos de "cursos" en "DataFrame" y actualizamos su nombre como "número". Luego, el método "print ()" ayuda a mostrar el marco de datos. Debajo de esto, primero utilizamos el método "GroupBy ()". Nos permite dividir sus datos en muchas categorías para que pueda ejecutar cálculos para un análisis más exhaustivo. "Groupby" este marco de datos colocando "sujetos" y luego utilizamos el método "Count ()".

La función Count () ofrece una entidad en serie con el resultado para cada fila después de contar el número de valores no vacíos para cada fila. Ponemos ambos métodos en la función "print ()" para que se muestre en el terminal.

Muestra primero el marco de datos original y luego los sujetos "groupby" y cuenta el número de sujeto. También agrega los mismos temas y lo escribe aquí. En este DataFrame, dos columnas contienen la asignatura de "matemáticas", por lo que muestra las "matemáticas" "2" y la asignatura de "estadísticas" "3".

Ejemplo # 02

Ahora, importamos "Pandas" y luego generamos datos y almacenamos estos datos en la variable "Data123". Tenemos columnas de "empleado" y "dirección" aquí. En "Empleado", insertamos nombres de empleados que son "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" y "Rick". En la "dirección", colocamos las direcciones de aquellos empleados que son "Londres", "América", "Sodán", "Londres", "Sodán", "Sodán", "América" ​​y "América".

Luego, declaramos y también inicializamos "lo mismo", que es un nombre variable e inicializamos con "PD.Marco de datos". También pasamos el parámetro "Data123" a este "PD.Marco de datos". Estamos utilizando el método "value_count ()" a continuación. La técnica de conteo de valor es mejor. Esta técnica dará el número total de valores distintos para una columna dada. Damos la columna "Dirección" aquí.

Tenemos el nombre de DataFrame que es "igual" y agregamos el nombre de la columna que es "Dirección". Luego, escriba la función o método "value_count ()". Agregamos esta declaración completa dentro del método "print ()" para que también se presente en la pantalla de la consola.

Después de representar el marco de datos en este resultado, cuenta las mismas direcciones de los empleados y las muestra a continuación y elimina el nombre de los empleados o elimina la columna "Empleado". Simplemente muestra la dirección y sus números que están presentes en este marco de datos.

Ejemplo # 03

Los datos aquí se insertan en cinco columnas. Creamos un marco de datos llamado "Estudiantes" y las columnas que tenemos son "Roll_No", "S_name", "S_instructor", "S_Course" y "Credit_HRS". En la columna "Roll_no", tenemos "A1, A2, A3, A4 y A5". Ahora, en la siguiente columna "S_NAME", estamos agregando los nombres de los estudiantes "Smith, Noah, Joseph, Mishi y William". Luego, estamos poniendo los nombres del instructor: "Peter, Taylor, James, Robert y Olivia". Los cursos que estamos insertando aquí son "Inglés, británico, inglés, árabe e inglés".

Para la columna "Credit_HRS", le agregamos "4, 5, 4, 3 y 4". Alteramos todos estos datos en el marco de datos y nombra este marco de datos o almacenamos este marco de datos en la variable "Estudiantes". Luego, empleamos "imprime ()" que representa este marco de datos. Debajo de esto, colocamos los métodos "Groupby ()" y "Count ()". Y ponte "s_couse" para que cuente los cursos y los muestre.

Tenemos 1 curso "árabe", 1 curso "británico" y 3 cursos de "inglés" aquí en este marco de datos. Obtenemos este recuento aplicando el método "Count ()".

Ejemplo # 04

En este ejemplo, el cuadro de datos creado contiene el "upload_date" en el que agregamos algunas fechas que se agregan a cinco fechas. Luego, inserte otra columna "Viewer_ids" en la que agregamos las ID de los espectadores como "V1, V2, V3, V4 y V5". Le damos el nombre de "video" a este marco de datos. Use "Groupby" primero que agrupa los datos en función de "upload_date" y luego usa el "count ()" que contará estos datos basados ​​en "upload_time". Finalmente, muestre el resultado.

Este es el resultado de este código y cuenta los datos basados ​​en el "tiempo de carga" de los videos. Los videos que se cargan en "2022-07-21" son dos en el recuento total.

Ejemplo # 05

El "estudio" es la variable que contiene datos que se encuentran en formularios de columna y fila. Los nombres de la columna son "cursos, c_fee y c_duration". La columna "Cursos" tiene "Pandas, Ubuntu, Linux, Python, Pandas, Linux, Spark, Python, Ubuntu, Python y Python". La columna "C_fee" contiene "22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 y 24000". La columna "C_Duration" contiene datos que son "30 días, 50 días, 35 días, 40 días, 60 días, 35 días, 30 días, 50 días, 50 días, 40 días y 40 días".

Cambiarlos en DataFrame y también imprima DataFrame. "Groupby ()" los "cursos y c_duration" y cuente aplicando "count ()". Estos métodos "Groupby" y "Count" agruparán los datos basados ​​en las columnas para cursos y duración. Entonces, calcule el recuento.

Aquí, agrupa los datos sobre los cursos y su duración y luego cuenta estos cursos utilizando el método "Count ()".

Conclusión

Esta guía está en el concepto de la función "AGG Count" en "Pandas."Hemos descrito cómo se usa la función de" recuento AGG "en pandas para contar. El método "AGG Count" se ha aplicado a las cinco instancias que hemos establecido.