Indexación de marco de datos de pandas

Indexación de marco de datos de pandas
En los pandas, la indexación implica elegir columnas y filas específicas de datos de un marco de datos. Elegir todas las filas e incluso algunas de las columnas, parte de las filas y todas las columnas, o algunas de cada una de las filas y columnas es lo que implica la indexación. La selección del subconjunto es otro nombre para la indexación. Cuando construimos un objeto Pandas DataFrame en Python usando el PD.DataFrame () Función Desde el módulo pandas, una dirección en los índices de fila o columna se produce automáticamente para simbolizar cada elemento/punto de datos dentro del DataFrame. Sin embargo, los índices de fila son el índice de Dataframe, mientras que los índices de columna simplemente se denominan columnas. El índice de un objeto Pandas Dataframe esencialmente identifica ciertas filas. Echemos un vistazo a cómo alterar el objeto DataFrame de datos del índice de Panda.

Ejemplo 1

La opción de índice en Python se puede utilizar para establecer el índice de un marco de datos a medida que se está creando. Generaremos una lista y la pasaremos al PD.Parámetro de índice del método dataFrame (). Pongamos esto en práctica con el código Python. Hemos importado el módulo pandas aquí. Después de eso, hicimos un diccionario y una lista de Python. El diccionario se utilizó para comenzar el desarrollo de DataFrame. Como puede ver, utilizamos la función DataFrame con el parámetro de índice para hacer que la columna "RR" sea el índice.

importar pandas como PD
dd = 'nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago', 'San Diego', 'Dallas']
RR = [1, 2, 3, 4, 5]
FF = PD.DataFrame (DD, index = RR)
Imprimir (FF)

Ver la salida en la siguiente imagen.

Ejemplo 2

En Python, podemos usar varios métodos para hacer el índice de cualquier columna o columnas existentes de un objeto Pandas DataFrame. En este escenario, utilizaremos el argumento Indeus Index () del módulo Python Pandas. El argumento injunto se establece en falso por defecto. Sin embargo, estableceremos el valor del lugar en verdadero en este caso. La columna existente pasó al PD.Establecer el método índice () como el nuevo índice reemplaza el índice anterior de DataFrame. Veamos cómo funciona esto.

importar pandas como PD
dd = 'nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Rollnum': ['1', '2', '3', '4', '5'],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
ff = ff.set_index ('rollNum')
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

La salida se da en la siguiente captura de pantalla.

Ejemplo 3

En este caso, utilizaremos el argumento de caída de la función set index () del módulo python pandas. Sin embargo, estableceremos el argumento de caída en falso en este caso. Para que el marco de datos no pierda la columna que se ha asignado como el nuevo índice. Establezcamos esto en práctica con el siguiente código.

importar pandas como PD
dd = 'rollnum': ['1', '2', '3', '4', '5'],
'Nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78]
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
ff = ff.set_index ('name', drop = false)
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

Aquí está el resultado.

Ejemplo 4

Al crear una lista de nombres de columnas de DataFrame y pasarlo a la función set index (), podemos establecer varias columnas del objeto Pandas DataFrame al igual que su índice. Como resultado, el índice se conoce como multiíndex en este escenario.

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
ff = ff.set_index (['rollNum', 'name'])
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

Aquí puede ver la salida del código dado anteriormente.

Ejemplo 5

Se pueden usar varias técnicas para establecer la posición del objeto Pandas DataFrame a cualquier objeto Python, como una lista, rango o incluso series. Usando el PD.Las funciones index (), set index () y range (), podemos establecer el índice del objeto DataFrame (pandas) en este enfoque. Primero, usaremos la función Range () para construir una secuencia de enteros de Python, que luego enviaremos al PD.Función índice (). Este método produce el objeto de índice de DataFrame. El objeto de índice DataFrame de devolución se establece como el nuevo índice del marco de datos utilizando la función SET index (). Implementemos este código.

importar pandas como PD
dd = 'rollnum': [1, 2, 3],
'Nombre': ['Alex', 'Ramen', 'Zayn'],
'Marcas': [33, 66, 88],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago']
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
my_list = ['i', 'ii', 'iii']
IDX = PD.Índice (my_list)
ff = ff.set_index (IDX)
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

Vea la salida a continuación.

Ejemplo 6

El índice del objeto Pandas DataFrame se puede establecer utilizando el índice set () y la PD.Métodos de índice (). Comenzaremos creando una lista de Python, que luego enviaremos al PD.Función índice (). Esta función dará un objeto de índice de marco de datos. El objeto de índice DataFrame de devolución se establece como el nuevo índice del marco de datos utilizando la función SET index ().

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
indx = PD.Índice (rango (1, 6, 1))
ff = ff.set_index (indx)
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

El resultado se da en la captura de pantalla adjunta.

Ejemplo 7

Usando el PD.Las funciones series () y establecer index (), podemos establecer el índice del objeto DataFrame de Pandas en el método anterior. Generar una lista y pasarla al PD.La función Series () devolverá una serie PANDAS que se puede utilizar como el objeto de índice DataFrame. La serie PANDAS resultante se pasa al método Set index (), que lo establece como el nuevo índice del marco de datos. Veamos el siguiente código y comprendamos cómo funciona esto.

importar pandas como PD
dd = 'rollnum': [1, 2, 3, 4, 5],
'Nombre': ['Alex', 'Ramen', 'Zayn', 'Travis', 'Scott'],
'Marcas': [33, 66, 88, 67, 78],
'Ciudad': ['Nueva York', 'Los Ángeles', 'Chicago', 'San Diego', 'Dallas']
FF = PD.DataFrame (DD)
Imprimir ("\ Ninitial DataFrame:")
Imprimir (FF)
ser_indx = PD.Serie ([5, 4, 3, 2, 1])
ff = ff.set_index (ser_indx)
imprimir ("\ nfinal dataFrame:")
Imprimir (FF)

Aquí puedes ver la salida.

Conclusión

La indexación es el proceso de seleccionar valores de filas y columnas específicas en un marco de datos. Podemos elegir todas las filas y algunas columnas o filas y todas las columnas utilizando la indexación. Esta sesión discutió temas como cuál es el índice y cómo puede establecer el índice mientras se genera un marco de datos, cómo puede establecer las columnas de marcado de datos existentes como un índice o incluso un Índice multi-de. o incluso la serie como índice.