Índice de cambio de pandas

Índice de cambio de pandas
En este artículo, intentaremos enseñarle cómo establecer el índice de DataFrame de Pandas utilizando una lista de etiquetas o las columnas ya existentes. Cubrimos todas las situaciones en las que se asignan las nuevas etiquetas de fila o las existentes deben cambiarse. La estructura tabular en el paquete pandas se denomina marco de datos. Cada fila y columna está representada por su etiqueta. Un índice es una etiqueta de fila, mientras que una etiqueta de columna es un índice de columna o encabezado. Python Pandas de forma predeterminada define un rango de números (comenzando en 0) como un índice para las filas al generar un marco de datos. Cada fila se identifica de manera única utilizando un índice de fila. Usaremos la función set_index () para cambiar los índices de filas en el marco de datos que crearemos o que se hayan creado de forma predeterminada.

Cómo cambiar el índice en columnas de pandas

Podemos hacer una de las columnas en DataFrame en el índice utilizando el método pandas set_index. Para comprender cómo funciona el método set_index (), veamos su sintaxis.

Sintaxis para el marco de datos.set_index

Marco de datos.set_index (keys, drop = true, append = false, inplace = false, verify_integrity = false)

Parámetro

  • llaves: Nombre de una columna o un conjunto de nombres de columna.
  • gota: Si es cierto, el valor booleano deja la columna de índice.
  • adjuntar: Si es cierto, agrega la columna a la columna de índice ya existente.
  • en su lugar: Si es verdadero, aplica los cambios a DataFrame.
  • Verificar integridad: Si es cierto, verifique si hay duplicados en la nueva columna de índice.

Como hemos visto en la sintaxis, ahora veremos cómo usar la función set_index () para establecer o cambiar los índices de un marco de datos en los siguientes ejemplos.

Ejemplo 1: Configuración del índice de DataFrame usando set_index () función

Primero se crea una muestra de datos de muestra con algunas filas y columnas. Aquí solo se crea un marco de datos simple que contiene un registro de estudiante "ficticio". El nombre, la edad, el sujeto y la tarifa son las cuatro columnas o variables en DataFrame "DF."

Primero importamos el módulo pandas para usar las características y funciones proporcionadas por la biblioteca. Entonces, se pasa un diccionario en los parámetros del PD.DataFrame () funciona como un argumento para crear un DataFrame de "DF".

Observe que en el lado izquierdo del marco de datos mostrado, hay un número al comienzo de cada fila (los números de 0 a 6). Estos números se conocen como índices. Ahora, usamos el método pandas set_index () para establecer el índice del marco de datos "DF". Para lograr esto, debemos escribir el nombre de DataFrame, seguido de un "punto" y luego el nombre del método que es "Establecer index ()". Usamos el nombre de la columna entre los paréntesis de la función set_index ().

La columna de "tarifa" ha tomado el lugar del índice entero anterior (0 a 6). Pasamos la columna de "tarifa" dentro de la función set_index () como un argumento para establecerla como el índice de fila de nuestro marco de datos.

Ejemplo 2: Establecer el índice de DataFrame usando una lista

También podemos proporcionar a DataFrame una lista de etiquetas que pueden ser cadenas o números. Usamos la función set_index () para crear un nuevo índice en el marco de datos utilizando el objeto de lista. Creemos nuestro marco de datos con datos ficticios después de importar los módulos PANDAS.

Nuestro DataFrame se crea con tres columnas: "Nombre", "Age" y "País", almacenando los datos ficticios. Ahora, utilizando una lista de etiquetas, se crea un índice de Python que luego pasaremos a DataFrame.Establecer la función index () como entrada.

Pasamos una lista que contiene las etiquetas de los índices de fila ['r1', 'r2', 'r3', 'r4', 'r5', 'r6'] al PD.función index () y la asigné a la variable "índice". Luego se pasa la variable como un argumento dentro de los paréntesis de la función set_index () para establecer los índices de DataFrame.

Como se ve en el cuadro de datos dado, nuestra lista especificada reemplazó el índice predeterminado del marco de datos con etiquetas ("R1", "R2", "R3", "R4", "R5", "R6").

Ejemplo 3: Establecer el índice del marco de datos utilizando múltiples columnas

Los marcos de datos en los pandas de Python que tienen más de una fila o columna como índice se conocen como marcos de datos multiíndexos. Usando DataFrame.Función set_index (), podemos establecer varias columnas como etiquetas de fila. Debe entenderse que establecer más de un índice hace que nuestro marco de datos sea complicado. El índice se puede estructurar de varias maneras. Le mostraremos cómo establecer las varias columnas como un índice de manera simple. Primero creemos nuestro marco de datos.

Nuestro DataFrame tiene cuatro columnas: "ID", "Nombre", "curso" y "Código".

De estas columnas, decidimos qué columnas son apropiadas para usar como índices de nuestro marco de datos. Después de decidir las columnas adecuadas, pasamos una lista con dos etiquetas dentro de la función set_index ().

Las columnas "ID" y "Código" se establecen como los índices de fila en DataFrame. Al usar los nombres de la columna dentro de la lista y pasarlos al set_index (), asignamos estas columnas como índices. La lista ["ID", "Código"] se pasa como el argumento del set_index (). Tanto el nombre como las columnas de la región son los nuevos índices, como se ve en la salida.

Ejemplo 4: establecer el índice del marco de datos utilizando la serie Python

Se puede crear un marco de datos multiíndexo asignando nuevas series utilizando el "DataFrame.Función set_index () "Cuando necesitamos cambiar el índice entero existente con algunas series de pandas en lugar de las columnas de DataFrame. Creamos primero un marco de datos al pasar un diccionario dentro del PD.Función DataFrame () para demostrar cómo se puede pasar una serie como los índices de primer y segundo nivel de DataFrame.

Ahora, creamos una serie pasando una lista de enteros dentro de los paréntesis del PD.Función Series (). Asignamos esta serie a la variable "n".

Como se ve en el marcado de datos dado, nuestra serie "n" y "n ** 2" se establecen como el primer y los índices de segundo nivel.

Ejemplo 5: Establecer el índice del marco de datos utilizando el rango de Python

Digamos que necesitamos especificar una serie de enteros como índice del marco de datos para que pueda comenzar en cualquier número. Por ejemplo, queremos iniciar el número de identificación del marco de datos del empleado en 1. No es posible usar DataFrame.set_index () función con una lista de todos los números como entrada. El método Python Range () se puede usar en esta situación. Al usar la función Range (), podemos crear un índice PANDAS que luego podemos pasar a DataFrame.Establecer la función index (). Creemos un marcador de datos para que podamos reemplazar su ROW_Index utilizando la función Range ().

Creamos nuestro marco de datos con las columnas "nombre", "rango", "bonificación" y "salario". Ahora, establezcamos el índice usando la función Range () en lugar del índice entero predeterminado. El método Range () devuelve una serie de números que comienza a 0 por defecto, aumenta en 1 (por defecto) y termina antes de un número especificado.

Especificamos el rango de índice para comenzar en 1, aumentar en 1 y terminar antes de las 6. Después de especificar el rango de índice, pasamos la variable "índice" en la función set_index () como una entrada para establecer el índice de fila de nuestro marcado de datos.

Conclusión

En este tutorial, discutimos los índices de un marco de datos y cómo establecer los nuevos índices en un marco de datos existente. Hemos visto que el constructor de Python crea un índice entero para cada fila de forma predeterminada, pero se puede cambiar utilizando la función set_index (). Hemos visto la sintaxis de la función set_index () en este tutorial e implementamos múltiples ejemplos para enseñarle cómo establecer el índice de fila del marco de datos usando listas, series y columnas en Pandas.