Pandas multiíndex

Pandas multiíndex
Cuando hablamos de las bibliotecas de código abierto de "Python", entonces "Pandas" es una de ellas. Utilizamos esta biblioteca cuando necesitamos manipular y analizar los datos. Podemos utilizar los módulos "Pandas" para crear las diferentes series o DataFrame. A veces, necesitamos ajustar las múltiples columnas como las columnas de índice en DataFrame. "Pandas" proporciona un método de "multiíndex" para crear más de un índice. El método "multiíndex" brinda la oportunidad de seleccionar las múltiples filas o columnas como índices de ese marco de datos. Aprenderemos sobre los métodos de "multiíndice" en esta guía y también haremos algunos códigos en los que utilizamos los métodos de "multiíndex" de "pandas" para crear múltiples índices.

Métodos de múltiples pandas

"Pandas" proporciona muchos métodos de "multiíndex" que utilizamos para crear múltiples índices. Estos son:

  • Multiíndex.de_frame
  • Multiíndex.from_product
  • Multiíndex.de_arrays
  • Multiíndex.de_tuples

Ahora, avanzamos y utilizamos estos métodos "multiíndex" que mencionamos anteriormente en el código "pandas" aquí.

Ejemplo 1:

El primer código de esta guía se da aquí. Hemos realizado todos los códigos que discutiremos en esta guía en la herramienta "Spyder". Cada vez que queremos desarrollar el código "pandas", tenemos que importar algunos módulos de "pandas". Podemos importarlos simplemente utilizando la palabra clave "importar" y escribir los "pandas como PD". Ahora, en este código, obtenemos las funciones de "Pandas" colocando "PD". Creamos algunas matrices aquí. La primera matriz se llama "Raw_names" y contiene "Smith, James, Bromley, Peter y Samuel". La siguiente matriz se llama "Raw_ages" en los que almacenamos los valores "10, 11, 15, 12 y 13". La última matriz que tenemos es el "Raw_Marks" que contiene el "90, 92, 83, 74 y 88".

Después de crear estas matrices, utilizamos el método "multiíndex" aquí, que es el "multiíndex.del método de_arrays () ". Colocamos el nombre de las tres matrices en este método, lo que significa que estas tres matrices se combinan para que los componentes de cada matriz puedan utilizarse para crear los índices múltiples. En los nombres, pasamos los "nombres, edades y marcas". Ahora, mostramos el resultado del código mencionado aquí utilizando la función "print ()".

Al presionar el "Shift+Enter", obtenemos este resultado. Cuando el código está libre de errores, el siguiente resultado se representa en la pantalla. Muestra el multiíndex aquí que creamos en este código:

Ejemplo 2:

En este código, creamos DataFrame. Creamos la lista de "Worker_information" aquí. Agregamos el "nombre" que aparece como el nombre de la columna cuando lo convertimos en DataFrame e insertamos "William, Timmy, James, Alexander y Graham". El "trabajo" contiene "ingeniero de software, probador de software, jugador, vendedor y maestro". Luego, tenemos el "Monthly_Salary" donde ponemos el salario de los trabajadores "$ 1500, $ 1200, $ 1100, $ 1300 y $ 1500". Luego, convertimos esta lista anidada en DataFrame. Utilizamos el "PD.DataFrame () "aquí para hacer esto.

Luego, el "print ()" nos ayuda a representar este marco de datos. Ahora, tenemos una variable aquí llamada "Resultado" y utilizamos el "Multiíndex.del método from_frame () "para crear todas las columnas como índice. Crea un multiíndex de este marco de datos dado con la ayuda de este método. Después de esto, agregamos esta variable en la "print ()", por lo que se presenta después de la ejecución.

Aquí, el marco de datos se ve primero en este resultado y el multiíndex se muestra junto con los siguientes valores. Obtenemos estos múltiples índices utilizando el "multiíndex.del método de_frame () ".

Ejemplo 3:

Utilizamos el "trabajador_df" en este ejemplo nuevamente. Esta vez, agregamos una nueva columna a este DataFrame que es "W_NO". También agregamos algunos datos a esta columna que es "W101, W102, W103, W104 y W105". Ahora, utilizamos otro método aquí para crear los múltiples índices de este marco de datos. Usamos el "DF.SET_INDEX "Método aquí en el que colocamos los nombres de dos columnas que son" w_no y nombre ". Luego, agregamos el "injunto" y "adjuntar" tanto a "verdadero" como a la "caída" a "falso". Entonces, no dejará caer las columnas.

Estas columnas aparecen dos veces en DataFrame. El índice, así como la columna, aparece aquí. Luego, aplicamos la "impresión ()" al "Worker_DF". El "trabajador_df" se representa. Ahora, también mostramos los índices por separado colocando "Worker_DF.Índice "en la" imprimir "después de mostrar la función de datos actualizada en el que establecemos estos múltiples índices.

En el primer DataFrame, solo aparece el índice predeterminado y no hay otra columna de índice en este DataFrame. Pero el siguiente marco de datos muestra múltiples índices. Puede ver fácilmente los índices "w_no y nombre" que creamos en el código. Estos índices junto con los valores se muestran por separado al final.

Ejemplo 4:

Construimos las diversas matrices nuevamente en este código. Los "Callum, Tyler, Chloe, Lewis, Hazel, John y Peter" están listados en la primera matriz. El "paciente_name" se llama aquí. La siguiente matriz, "paciente_age", contiene los valores "28, 33, 45, 17, 22, 44 y 29". La última matriz se llama "paciente_contact" y contiene los números "1001234, 1001235, 1001236, 1001237, 1001238, 1001239 y 1001240".

Aquí, usamos el método "multiíndex" que es el "multiíndex.desde la función de_arrays () "después de crear estas matrices. Luego pasamos los nombres de estas tres matrices en el "Multiíndex.from_arrays ”para crear estas matrices como los índices aquí. También agregamos el "padre, edad y contacto" en los nombres. Después de esto, tenemos el "print ()" que nos ayuda a representar los datos de la variable "paciente" donde almacenamos los índices múltiples después de aplicar el "multiíndex.Método de_arrays ".

Este resultado muestra todos los índices que agregamos al código. El nombre también se menciona aquí. Todas las matrices se establecen aquí como índices múltiples con la ayuda del "Multiíndex.del método de_arrays () ".

Ejemplo 5:

Ahora, aquí está el último código de esta guía donde generamos DataFrame y creamos los índices múltiples de este marco de datos. Para crear DataFrame, debemos agregar algunos datos aquí. Agregamos todos los datos en la variable "XYZ". Primero agregamos el "xyz_name" que contiene "John, Michael, Foster, Samuel, Bromley, Smith y Fuller". Luego, tenemos "xyz_codes" y ponemos "xyz23, xyz24, xyz25, xyz26, xyz27, xyz28 y xyz29". Ahora, viene el "xyz_month" que contiene "enero, febrero, marzo, abril, mayo, junio y julio". Luego agregamos el "xyz_units" en el que ponemos "20, 14, 19, 46, 35, 20 y 53".

Ahora, creamos el "xyz_dataframe" y colocamos el "PD.Método DataFrame () "aquí que crea el DataFrame de los datos" XYZ ". Luego, también mostramos el "xyz_dataframe". Ahora, creamos los índices múltiples del DataFrame, por lo que usamos el "MultiDdex.del método de_frame () ". Esto crea los múltiples índices de este marco de datos y los almacena en la variable "xyz_dataframe1". Esta variable también se coloca en la "impresión ()" para que estos índices se muestren en el terminal.

Muestra el "xyz_dataframe". Luego, están los índices que se crean después de aplicar el "Multiíndex.del método de_frame () ". Todos los índices junto con los valores y los nombres de la columna se muestran en este resultado.

Conclusión

Esta guía está escrita aquí para aclarar el concepto del "Multiíndice" en "Pandas". Discutimos los diferentes métodos de "multiíndex" que "Pandas" proporciona. También discutimos algunos de ellos en detalle aquí. Aplicamos estos métodos en los códigos "pandas" aquí y mostramos cómo se crean los múltiples índices en "pandas" con la ayuda de métodos "multiíndex". Aplicamos estos métodos a matrices y marcos de datos y explicamos todos estos códigos con detalle profundo. Mostramos el marco de datos antes de crear los índices múltiples y después de crear los índices múltiples utilizando el método múltiple "pandas" múltiple. Mostramos los múltiples índices por separado en estos códigos también.