Conteo de pandas distinto

Conteo de pandas distinto
Este artículo explorará varias formas y métodos para determinar el número de elementos únicos en un marco de datos de Pandas.

Data de muestra

Antes de discutir cómo determinar el número de valores únicos en un marco de datos, necesitaremos datos de muestra.

A continuación se muestra un código de ejemplo:

# Pandas de importación
importar pandas como PD
DF = PD.Marco de datos(
'Salario': [120000, 100000, 90000, 110000, 120000, 100000, 56000],
'Departamento': ['Desarrollador de juegos', 'Desarrollador de bases de datos', 'Desarrollador front-end', 'Desarrollador de pila completa', 'Desarrollador de bases de datos', 'Investigador de seguridad', 'Engineador en la nube']],
'Calificación': [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4],
index = ['Alice', 'Michael', 'Joshua', 'Patricia', 'Peter', 'Jeff', 'Ruth'])
df

El código anterior debe crear una muestra de datos de muestra que podamos usar en este tutorial. La forma tabular resultante de los datos es como se muestra:

#1 Método único de pandas

La función única () es el primer método que podemos usar para determinar el número de valores únicos en un marco de datos.

La función toma una serie como la entrada y devuelve una lista de los valores únicos.

Por ejemplo, para calcular los elementos únicos en la columna salarial, podemos hacer:

Imprimir (PD.único (df ['salario']))

El código anterior debe devolver los elementos únicos en la columna 'Salario'.

[120000 100000 90000 110000 56000]

Si desea el número de valores únicos, puede obtener la longitud de la lista como se muestra:

Imprimir (F "Elementos únicos: Len (PD.único (df ['salario'])) ")

El código anterior debería devolver:

Artículos únicos: 5

#2 Función Nunique Pandas

La función nunique () le permite obtener el número de valores únicos a lo largo de un eje especificado.

Un ejemplo es como se muestra:

imprimir (f "[número de elementos/columna únicos] \ n df.nunique (axis = 0) ")

El código anterior debe devolver el número de elementos únicos en cada columna. La salida resultante es como se muestra:

[Número de elementos/columna únicos]
Salario 5
Departamento 6
Calificación 4
dtype: int64

También puede obtener el número de elementos únicos en una columna específica como se muestra:

Imprimir (DF.salario.Nunique ())

Lo anterior debe devolver el número de elementos únicos en la columna salarial.

#3 pandas value_counts ()

Pandas también nos proporciona la función value_count (). Esta función devuelve el número de valores únicos en una columna especificada.

Un ejemplo es como se muestra:

res = lista (DF.salario.value_counts ())
imprimir (f "elementos únicos: len (res)")

La función value_counts () devuelve el recuento de cada valor en la columna. Luego convertimos el resultado en una lista y obtenemos la longitud.

Esto debería obtener el número de elementos únicos en la columna:

Artículos únicos: 5

Conclusión

Este artículo discutió varios métodos y técnicas que podemos usar para determinar el número de valores únicos en un marco de datos de pandas.