Los pandas obtienen el valor más frecuente

Los pandas obtienen el valor más frecuente
El objetivo de este artículo es mostrar el valor más frecuente en un conjunto de números. Para resumir el número de veces que aparece un elemento o número, se usa la función Value_Counts () de Python (). El método mode () se puede usar para obtener el elemento más frecuente. Si desea diferentes formas de obtener los valores más frecuentes en Python, este artículo tiene todas las pautas.

¿Cuál es el método value_counts () en Python??

Los valores únicos de un objeto pandas se cuentan utilizando el método de conteo de valor (). En Python, generalmente empleamos esta técnica para disputas de datos y exploración de datos.

El método value_counts () puede funcionar con una variedad de objetos pandas. La serie Pandas, Pandas Dataframes y Dataframe columnas son ejemplos de estos (que son objetos de la serie Pandas).

Sin embargo, dependiendo del tipo de objeto con el que esté trabajando, cómo implementa el método value_counts () diferirá ligeramente.

Se pueden usar otros argumentos opcionales para alterar la funcionalidad del método value_counts ().

Sintaxis de la función de la serie Pandas ()

En una serie de pandas, el valor más común es simplemente el modo de la serie. El método de modo de serie Pandas () se utiliza para adquirir información sobre el modo. La sintaxis es la siguiente. Los modos de la serie se devuelven en orden ordenado.

# df ['columna'].modo()

Sintaxis de la función Pandas value_counts ()

Para obtener el valor de conteo más alto, use las funciones pandas value_counts () e idxmax () simultáneamente. La sintaxis es la siguiente:

# df ['columna'].value_counts ().IDXMAX ()

Ahora veamos algunos ejemplos prácticos para ver cómo puede lograr los valores más frecuentes siguiendo qué pasos.

Ejemplo 1:

Primero debemos establecer el marco de datos antes de continuar con los pasos de determinar el valor más frecuente con el modo (). Este es un marco de datos con un campo de categoría que usaremos para el resto del tutorial. DataFrame 'd_frame' contiene los nombres ('kim', 'kourtney', 'scott', 'rob', 'kendall', 'gathie', 'phill') e información de equipo ('a', 'b', ',' C ',' d ',' e ',' a ',' b ',' a ',' b ',' a '). La columna "Equipo" de DataFrame es un campo de categoría con valores que denotan el equipo asignado a cada alumno.

El módulo pandas se importa al comienzo del código en el código de referencia a continuación. El marco de datos se genera y se presenta en la pantalla.

importación de pandas
d_frame = pandas.Marco de datos(
'Nombre': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipo': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
imprimir (d_frame)

En la imagen a continuación, los nombres de los estudiantes se muestran junto con el nombre del equipo al que han sido asignados.

Le mostraremos cómo usar la función de modo () para determinar el valor más frecuente. El modo, que es una estadística descriptiva, es básicamente el valor más común en el conjunto de datos. Le dará información sobre el equipo que tiene la mayoría de los estudiantes.

Hemos importado primero el módulo pandas y generamos el marco de datos, como puede ver en el código. Los nombres de los estudiantes y el equipo están incluidos en el marco de datos.

importación de pandas
d_frame = pandas.Marco de datos(
'Nombre': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipo': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
imprimir (d_frame ['equipo'].modo())

Da una serie Pandas más el modo de la columna. Debido a que "A" y "B" son los valores más frecuentes en el campo "Equipo", obtenemos "A" y "B" como modo.

Tenga en cuenta que puede adquirir el modo de cada columna en un Pandas DataFrame utilizando el método Mode ().

Ejemplo 2:

Le mostraremos cómo usar value_counts () para obtener el valor más frecuente en este ejemplo. La función value_counts () se puede usar para obtener recuentos, y luego la función idxmax () se puede usar para obtener el valor con la mayoría de los recuentos.

El resto del código, excepto la última línea, es idéntico al anterior. Demuestra cómo se usa la función (value_counts) para averiguar el valor con el recuento más alto.

importación de pandas
d_frame = pandas.Marco de datos(
'Nombre': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipo': ['A', 'B', 'C', 'D', 'E', 'A', 'A']
)
imprimir (d_frame ['equipo'].value_counts ().idxmax ())

Vea la pantalla resultante a continuación. Obtenemos el valor en la columna "equipo" con el recuento de valor máximo.

Ejemplo 3:

Este ejemplo demostrará lo que sucederá si el marco de datos contiene los valores más frecuentes. Cambiemos el marco de datos para que la columna "equipo" contenga modos repetidos. Cambiamos el valor de "Rob" "Team" de "D" a "B" aquí.

importación de pandas
d_frame = pandas.Marco de datos(
'Nombre': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipo': ['A', 'B', 'C', 'd', 'e', ​​'a', 'f']
)
D_FRAME.en [3, 'equipo'] = 'B'
imprimir (d_frame)

Ahora tenemos modos recurrentes, como puede ver. "A" aparece dos veces en la columna "Equipo" en nuestro escenario.

El nombre del equipo para el estudiante 'Rob' ha sido cambiado de "D" a "A" en la imagen acompañante.

Ejemplo 4:

Veamos qué cuenta el valor () e idxmax () los métodos return. Hemos actualizado los valores de DataFrame en este código de ejemplo. Observe que el equipo "A" y "B" aparecen dos veces. Después de eso, usamos el valor.Las funciones de Counts () e idxmax () para determinar el valor más común en DataFrame. Aquí está el código de referencia.

importación de pandas
d_frame = pandas.Marco de datos(
'Nombre': ['Kim', 'Kourtney', 'Scott', 'Rob', 'Kendall', 'Gathie', 'Phill'],
'Equipo': ['A', 'B', 'C', 'D', 'E', 'A', 'B']
)
imprimir (d_frame ['equipo'].value_counts ().idxmax ())

Tenga en cuenta que incluso si hay muchos modos presentes, este método solo devuelve un solo valor. Esto sucedió porque la función idxmax () ofrece solo un resultado: "Si múltiples valores coinciden con el máximo, se devuelve el título de una fila con ese valor."Para recuperar el valor más común en una serie Pandas, debe aplicar la función 'Mode ()' de la serie Pandas.

Conclusión:

En este artículo, observamos cómo encontrar el valor más frecuente en una columna o serie de pandas utilizando ciertos ejemplos. Hemos discutido una variedad de funciones que se pueden usar para lograr este objetivo. MODE (), Value Counts () e IDXMax () son algunos de estos métodos. Si es nuevo en este concepto y necesita una guía paso a paso para comenzar, no vaya más allá de este artículo.