Índice de set de pandas

Índice de set de pandas
La función "set_index" de Pandas se usa para definir el marco de datos o la serie como la clave de un marcado de datos. La función "set_index ()" de Pandas crea el índice DataFrame aprovechando columnas preexistentes. El índice puede sustituir o expandir el índice actual.

La sintaxis para este método es la siguiente:

El primer parámetro "teclas" clasifica el nombre de la columna que queremos establecer como índice. El atributo "agregar" agrega la columna proporcionada cuando el valor del índice se establece en verdadero. El parámetro "Drop" suelta las columnas. Su valor predeterminado es "verdadero". El "injunto", cuando se valora como "verdadero", realiza los cambios en el marco de datos original y no crea ninguna copia de ella. El último parámetro "Verify_integrity" verifica la duplicación del nuevo índice de columna.

Aprenderemos la ejecución práctica de este método a través de varias técnicas en este artículo.

Ejemplo # 1: utilizando el método set_index () para cambiar la columna de índice

Esta demostración explicará el uso de los pandas "DF.Método set_index () "para cambiar la lista de índice predeterminada en un marcador de datos a una columna de índice definida por el usuario.

La herramienta "Spyder" se inicia para comenzar a trabajar en la compilación y ejecución del script. Primero hemos cargado las bibliotecas requeridas en el programa. El paquete que necesitábamos aquí es el "pandas". Entonces, lo importamos como "PD".

Hemos generado un marco de datos empleando el método Pandas "PD.Marco de datos()". Tiene la opción de importar un archivo CSV o crear un marco de datos utilizando el "PD.Método DataFrame () ". El "PD.DataFrame () "Función en Invoced con 4 columnas" Emp_name "," Experiencia "," Ingresos "y" Bono ". Cada columna almacena 11 valores.

Tenemos valores para la columna "EMP_NAME" como "a", "b", "c", "d", "e", "f", "g", "h", "i", "j", y "K". Las entradas para la columna "Experiencia" son "5", "2", "17", "21", "9", "20", "11", "32", "23", "14" y "30". La tercera columna que tenemos es "Ingresos", que almacena estos valores "40000", "30000", "100000", "50000", "40000", "70000", "200000", "95000", "60000", "27000" y "98000". La columna "Bonus" mantiene estos valores "30000", "40000", "60000", "30000", "86000", "50000", "60000", "95000", "76000", "27000", y "78000".

El "PD.El método DataFrame () ”construirá un marco de datos con estos valores proporcionados. Para almacenar el DataFrame, hemos creado un objeto DataFrame "registro". Lo asignamos la salida de llamar al "PD.Función DataFrame () ". Por último, el contenido se exhibe en la consola ejerciendo la función "print ()" de Python.

Cuando ejecutamos el programa Python haciendo clic en la opción "Ejecutar archivo", vemos un marco de datos con 4 columnas y 11 filas. Este marco de datos se ha mostrado con la lista de índice predeterminada que comienza desde "0" y sube a la longitud del DataFrame.

Es posible que deba cambiar la columna de índice de DataFrame a veces. Aquí aprenderemos a cambiar la columna de índice en un marco de datos utilizando el "DF.Método set_index () ". Al usar este método, cambiaremos la columna de índice predeterminada con una columna existente en el marcado de datos proporcionado.

Hemos invocado el "DF.Método set_index () ". El nombre de DataFrame se suministra como "registro" con la función "set_index ()". Entre los paréntesis de esta función, hemos proporcionado el nombre de la columna que necesitamos establecer como la columna de índice en el marcado de datos resultante. La columna que hemos mencionado es "Emp_Name". Entonces, el método "set_index ()" analizará el marco de datos "registrar", encontrar la columna etiquetada como "emp_name" y establecerlo como la columna de índice después de dejar caer la columna de índice predeterminado. El resultado se guarda en la variable "configuración". Con la ayuda de la función "print ()", la mostramos en la pantalla.

La columna de índice de DataFrame de salida se cambia de la lista predeterminada a "Emp_Name". La salida resultante se proporciona en la imagen a continuación.

Ejemplo # 2: utilizando el método set_index () para cambiar el índice a múltiples columnas de índice

Al cambiar el índice de DataFrame, podemos establecer incluso más de una columna como los índices del marco de datos. Explore el concepto a través del programa Python.

Para esta ilustración, hemos utilizado el marco de datos creado en el ejemplo anterior. El "DF.el método set_index () "se invoca. Hemos llamado a la función con los siguientes parámetros: "claves", "innace", "agregar" y "soltar". Las claves de índice que hemos proporcionado aquí son "Emp_name" y "Ingresos". Se han seleccionado dos columnas porque necesitamos establecer más de una columna como índices en DataFrame. El parámetro "inplace" se establece "verdadero", lo que significa que las posibilidades se harán en el marco de datos real sin crear ninguna copia de ella.

Hemos establecido el valor "verdadero" para el atributo "adjunto". Mantenerlo verdadero agregará las nuevas columnas de índice con la columna de índice ya existente o predeterminada. La última propiedad que hemos usado aquí es "caer" con el valor "falso". Por lo tanto, no soltará las columnas que hemos establecido para el índice del DataFrame. Como se prefiere que los cambios se realicen en el marco de datos real, para que no necesitemos crear ningún objeto. Simplemente imprimir el marco de datos real después de configurar el índice nos mostrará los cambios. Hemos empleado la función "print ()" para mostrar el resultado.

Se muestra nuestro DataFrame real actualizado que tiene una columna de índice predeterminada, así como las dos columnas de índice recientemente especificadas como "Emp_name" e "Ingresos".

Ejemplo # 3: Utilizando el método set_index () para cambiar la columna de índice con la columna de valor flotante

También podemos cambiar la columna de índice predeterminada y establecer una columna de flotación como indexador en DataFrame. Veremos su implementación práctica aquí.

Primero tenemos que crear una columna con valores flotantes en el marco de datos. El marco de datos de la primera instancia se usa nuevamente, excepto que los valores en la columna "bonificación" están flotando ahora. Hemos proporcionado estos valores para la columna "bonificación": "30.87 "," 40.16 "," 60.98 "," 30.87 "," 86.32 "," 50.92 "," 60.11 "," 95.12 "," 76.24 "," 27.35 "y" 78.52 ". Luego, imprimimos la función de datos actualizada utilizando la función "print ()".

Se exhibe el marco de datos con la columna actualizada de "bonificación".

Invocamos el "DF.set_index () "y configure la columna de la tecla de índice como" bonificación ". El parámetro "inplace" se valora como "verdadero". Entonces los cambios se realizarán en el marco de datos real.

La columna flotante se establece como la columna de índice en el marco de datos que se puede ver en la imagen a continuación.

Ejemplo # 4: Utilizando el método set_index () para establecer multiindex en la copia de DataFrame

Podemos establecer MultiDindex en DataFrame utilizando el método "set_index ()". El método "set_index" se invoca con el nombre del "registro" de DataFrame. Dentro de los aparatos ortopédicos, hemos inicializado el operador de subíndice y definimos los nombres de las columnas como "emp_name" y "experiencia". Aquí, hemos preferido ejecutar la función con la configuración predeterminada donde "innace" se establece como "falso". Las manipulaciones se llevarán a cabo en la copia de DataFrame.

Para almacenar esta copia de DataFrame, hemos creado una variable "multi_index". Finalmente, exhibimos el contenido de la copia de DataFrame almacenada en la variable "multi_index" utilizando la función "print ()".

Esto nos da el siguiente resultado:

Conclusión

En esta sesión de aprendizaje, hemos demostrado la necesidad de cambiar la columna de índice en un marco de datos. Método proporcionado por Pandas "DF.set_index "se utiliza en este tutorial para lograr el resultado deseado. Hemos proporcionado la sintaxis para emplear esta función con una breve descripción de los parámetros. Todas las técnicas para ejercer la función "set_index ()" se implementan prácticamente en la herramienta Spyder. Podemos utilizar el método de acuerdo con nuestra necesidad de si queremos establecer una sola columna como clave de índice o múltiples columnas.