Pandas DataFrame único

Pandas DataFrame único

La biblioteca de Python más popular que se utiliza en la ciencia de datos se llama pandas. Ofrece a los programadores de Python de alto rendimiento, fáciles de usar y herramientas de análisis de datos. Una vez que comprenda las funciones fundamentales y cómo utilizarlas, Pandas es una herramienta potente para alterar los datos. En "pandas", los métodos estándar para almacenar datos en forma tabular son los marcos de datos. Podemos utilizar algunos métodos de "pandas" para obtener los valores únicos en la columna de DataFrame de "pandas". Cuando necesitamos obtener valores únicos en las columnas de DataFrame y no queremos la duplicación de valores en la columna de DataFrame de "pandas", podemos usar los métodos que "Pandas" proporciona para hacer esto. Veamos tales métodos en esta guía, junto con algunos ejemplos y salida para obtener valores únicos en la columna de DataFrame de "Pandas".

Métodos para obtener valores únicos en las columnas de DataFrame "Pandas"

Podemos utilizar dos métodos para obtener los valores únicos en las columnas de DataFrame de "pandas". Dejamos caer los valores duplicados y solo obtenemos los valores únicos en las columnas de DataFrames. Los métodos que "Pandas" proporcionan para hacer esta tarea son:

  • Utilizando el método único ().
  • Utilizando el método drop_duplices ().

Ahora, utilizaremos ambos métodos en los códigos de "pandas" para obtener los valores únicos en las columnas de DataFrame de "pandas".

Ejemplo # 01

La aplicación "Spyder" se utiliza aquí para generar estos códigos "Pandas" para utilizar aquellos métodos que nos ayudan a obtener los valores únicos en las columnas de DataFrame de "pandas". Debemos importar los módulos "pandas", que son necesarios para el código "pandas", antes de crear el marco de datos. Al usar el término "importar" y colocar "pandas como pd", importamos estos módulos.

Ahora, con la ayuda de "PD", podemos obtener rápidamente las funciones o métodos de "pandas". Luego colocamos el "asign_data" en el que agregamos "nombre" y en el "nombre", estamos agregando los datos del nombre que son "Roman, William, Peter, Smith, John, Milli, Thomas y James". Luego, agregamos los datos de la asignatura en el "Subj" que son "Matemáticas, Economía, Ciencias, Matemáticas, Estadísticas, Estadísticas, Estadísticas y Computación". Luego, convertimos este "asign_data" en el marco de datos "asign_df" utilizando el "PD.Método DataFrame () ". Colocamos "temas_df" en el método "print ()" para que se muestre en el terminal.

Ahora, queremos obtener los valores únicos en la columna "Subj" de DataFrame de "Pandas". Para este propósito, estamos utilizando el método "único ()" aquí y agregamos el nombre de la columna y también el nombre de DataFrame como se muestra a continuación. Agregamos este método en la "print ()" para que el resultado también se muestre en el terminal.

Ahora, estamos presionando el "Shift+Enter" para obtener el resultado de este código y se presenta en el terminal y también se muestra aquí, que contiene el marco de datos con todos los valores. Este es el marcador de datos original que hemos agregado en el código y debajo muestra los valores únicos de la columna "Subj". Deja caer los valores duplicados y muestra los valores únicos de la columna "Subj" del marco de datos.

Ejemplo # 02

Creamos el "sample_list" que contiene información. Insertamos "Layla, 21, 28, 31, 14 y 39", que aparecerá como la primera columna cuando convertimos esta lista en DataFrame. Luego, agregamos "lusy, 31, 25, 34, 26 y 21" como la segunda fila del marco de datos. Después de esto, tenemos "Peter, 38, 20, 20, 35 y 24" y "Layla 38, 23, 39 24, 23", que será la tercera y cuarta filas del marco de datos. También insertamos tres datos más que son "Stella, 21, 24, 24, 28, 31", "Layla, 33, 32, 26, 30, 25" y también "Peter, 21, 21, 31, 21, 29".

Ahora, estamos convirtiendo el "sample_list" en el "df_sample", que es el nombre del marco de datos aquí colocando el "PD.Función DataFrame () ". Además, establecemos el nombre de las columnas de este marco de datos y estos nombres son "Nombre, ASS_1, ASS_2, ASS_3, ASS_4 y ASS_5". Luego, usamos el "print ()" que ayuda a mostrar el DataFrame "DF_Sample". Ahora, estamos utilizando otro método en este ejemplo para obtener los valores únicos en la columna de DataFrame. Este método es el método "drop_dupplicates ()" de "pandas".

En el método "drop_dupplicates ()", establecemos el nombre de la columna donde queremos obtener los valores únicos en la columna de DataFrame. Estamos obteniendo valores únicos de la columna "Nombre" al soltar los valores duplicados en esta columna con la ayuda del método "drop_dupplicates ()" y también representa estos valores únicos utilizando la función "print ()" aquí.

Los nombres que se duplican se eliminan y los valores únicos se representan después de aplicar el método "drop_dupplicates ()". Puede tener en cuenta que el nombre "Layla" aparece en tres celdas de la columna "Nombre". Pero cuando se aplica el método "drop_dupplicates ()" a esta columna, todos los valores duplicados se eliminan y se ha aparecido un nombre de "Layla" en la pantalla. Después de dejar caer los valores duplicados, apareció el nuevo cuadro de datos que contiene los valores únicos en esta columna de "nombre". De esta manera, podemos eliminar los valores duplicados y obtener el valor único en la columna del marco de datos con la ayuda del método "drop_dupplicates ()".

Ejemplo # 03

El mismo DataFrame se utiliza nuevamente y ahora estamos aplicando el método "único ()" aquí. Con el método "único ()", colocamos el nombre de la columna, así como el nombre de DataFrame en el que queremos aplicar este método "único ()" para obtener los valores únicos. Esto solo representará los valores únicos de esa columna y no mostrará estos valores en forma de DataFrame.

Aquí, DataFrame contiene siete valores en la columna "Nombre", pero cuando aplicamos el método "único ()" a esta columna, solo han aparecido cuatro valores y estos son los valores únicos de esa columna. No rinde valores duplicados.

Ejemplo # 04

DataFrame que creamos en este ejemplo es el "F_G_DF". Insertamos "my_fruits" y "my_vegs" en este marco de datos. La columna "my_fruits" contiene "manzana, naranja, manzana, pera, lichi, manzana, manzana, pera y manzana". A continuación, tenemos el "my_vegs" que contiene los nombres de las verduras que son "chile, traingle, zanahoria, papa, papa, zanahoria, cebolla, ajo y jengibre". Este marco de datos contiene solo dos columnas.

Ahora, estamos obteniendo los valores únicos en ambas columnas con la ayuda del método "único ()". Mencionamos el nombre de DataFrame. Luego, coloque el nombre de la primera columna de la columna. Después de esto, utilizamos el método append (). En este anexo, nuevamente colocamos el nombre de DataFrame y el nombre de la segunda columna y colocamos el método "único ()". Esto obtendrá los valores únicos de ambas columnas y luego agregará los valores únicos de ambas columnas y los aparecerá en la pantalla.

El marco de datos se representa primero que contiene todos los valores. Después de esto, se aplica el método "único ()" y los valores únicos de ambas columnas se representan a continuación. En este código, obtenemos los valores únicos en las múltiples columnas de DataFrame utilizando el método "único ()".

Conclusión

La explicación completa de obtener los valores únicos en la columna de DataFrame se encuentra en esta guía. Hemos discutido los métodos "únicos ()" y "Drop_Duplate ()" que nos ayudan a obtener los valores únicos de la columna DataFrame. Hemos explorado cómo usar estos métodos en el código "pandas" utilizando estos métodos aquí en nuestros códigos. Hemos ilustrado diferentes ejemplos en esta guía y le hemos demostrado cómo obtener los valores únicos de una columna utilizando el método "único ()", así como el método "drop_dupplicates ()". También hemos explorado cómo obtener los valores únicos en varias columnas utilizando el método "único ()" en esta guía.