Índice duplicado de pandas caída

Índice duplicado de pandas caída
Pandas tiene un método llamado "índice.drop_dupplicates () ”que nos permite soltar los índices duplicados de la lista de etiquetas de índice. El índice.La función drop_dupplicates () ”en pandas devuelve un índice con las entradas duplicadas descartadas. La función le da al usuario la libertad de seleccionar qué valor duplicado debe mantenerse. Tenemos dos opciones: eliminar las primeras y las últimas entradas duplicadas de la lista o eliminar todos los datos duplicados de la lista.

Si desea utilizar esta función, se debe seguir la siguiente sintaxis:

Sintaxis:

pandas.Índice.drop_dupplicates (Keep = 'First')

Parámetro:
El "MantenerEl parámetro se utiliza para regular cómo manejar los valores duplicados. Se necesita "mantener". Por defecto, el valor es "primero".

  1. Cuando el valor es "primero", El programa trata el primer elemento como distinto y los otros valores idénticos como duplicados. Esto, con la excepción de la primera instancia, elimina los duplicados.
  2. Si el valor se establece en "último", Trata la última entrada como única y los otros valores idénticos como duplicados. Luego elimina todos los duplicados, excepto la última aparición de ese valor.
  3. Si el parámetro "mantener" tiene el "FALSO"Valor, todos los valores idénticos se tratan como duplicados. Deja caer todos los valores duplicados de la lista.

Ejemplo 1: sin parámetros
En este ejemplo, tenemos un índice llamado "index1" que posee 10 enteros. Eliminemos los duplicados sin pasar ningún parámetro a la función Drop_Duplate ().

importación de pandas
# Crear índice de pandas que contengan 10 valores
índice1 = pandas.Índice ([45,67,45,89,45,89,12,34,67,89])
Imprimir ("Índice real:", índice1)
imprimir ("Índice único:", index1.drop_dupplicates ())

Producción:

Explicación:
Los índices únicos se devuelven eliminando los duplicados.

Ejemplo 2: con mantener como falso
Tengamos un índice que contenga 5 cadenas con duplicados. Ahora, establezca el parámetro "Mantener" en falso.

importación de pandas
# Crea un índice de pandas que contienen 5 cuerdas
índice1 = pandas.Índice (['i1', 'i1', 'i4', 'i5', 'i4'])
Imprimir ("Índice real:", índice1)
imprimir ("Índice único:", index1.drop_dupplicates (Keep = False))

Producción:

Explicación:
Solo hay un índice único: "i5". Se devuelve eliminando todos los duplicados.

Ejemplo 3: con mantener como primero
Tengamos el "índice1" con 10 valores y "index2" con 5 cadenas. Establezca "Keep" para "primero" para soltar los duplicados sin eliminar el primer hecho.

importación de pandas
# Crear índice de pandas que contengan 10 valores
índice1 = pandas.Índice ([45,67,45,89,45,89,12,34,67,89])
Imprimir ("Índice real 1:", índice1)
# Dipplicados de caída sin eliminar la primera ocurrencia
Imprimir ("Índice único 1:", índice1.drop_dupplicates (Keep = 'First'))
# Crea un índice de pandas que contienen 5 cuerdas
índice2 = pandas.Índice (['i1', 'i1', 'i4', 'i5', 'i4'])
Imprimir ("Índice real 2:", índice2)
# Dipplicados de caída sin eliminar la primera ocurrencia
imprimir ("Índice único 2:", índice2.drop_dupplicates (Keep = 'First'))

Producción:

Explicación:

  1. En "index1", [45, 67, 89, 12, 34] son ​​la primera aparición de valores únicos.
  2. En "index2", ['i1', 'i4', 'i5'] son ​​la primera aparición de valores únicos.

Ejemplo 4: con mantener como último
Tengamos el "índice1" con 10 valores y "index2" con 5 cadenas. Establezca "Keep" para "primero" para soltar los duplicados sin eliminar el primer hecho.

importación de pandas
# Crear índice de pandas que contengan 10 valores
índice1 = pandas.Índice ([45,67,45,89,45,89,12,34,67,89])
Imprimir ("Índice real 1:", índice1)
# Drop Duplicate sin eliminar la última ocurrencia
Imprimir ("Índice único 1:", índice1.drop_dupplicates (Keep = 'Last'))
# Crea un índice de pandas que contienen 5 cuerdas
índice2 = pandas.Índice (['i1', 'i1', 'i4', 'i5', 'i4'])
Imprimir ("Índice real 2:", índice2)
# Drop Duplicate sin eliminar la última ocurrencia
imprimir ("Índice único 2:", índice2.drop_dupplicates (Keep = 'Last'))

Producción:

Explicación:

  1. En "index1", [45, 12, 34, 67, 89] son ​​la última aparición de valores únicos.
  2. En "index2", ['i1', 'i5', 'i4'] son ​​la última aparición de valores únicos.

Conclusión

Este tutorial se basa en el concepto de dejar caer los índices duplicados utilizando el módulo pandas. Utilizamos el índice de pandas ".método drop_dupplicates () ”. Proporcionamos la sintaxis para la utilización de este método y también describimos sus parámetros. Este método nos ofrece tres opciones para tratar con valores duplicados. Cada paso de este artículo se explica muy clara y simplemente.