Los índices de las filas se conocen como índices de marco de datos, mientras que los índices de columnas se conocen como nombres generales de columnas. Los índices se utilizan principalmente para recuperar los datos o almacenar los datos dentro del marco de datos. Sin embargo, también podemos recuperar el índice en sí mismo usando el .propiedad índice. En este tutorial, le enseñaremos cómo obtener un índice como objeto de lista, cómo puede convertir el índice en una columna DataFrame para recuperarlo y cómo puede obtener el índice utilizando múltiples condiciones y la propiedad de índice de PANDAS.
Cómo obtener valores de índice en pandas?
DataFrame.La propiedad del índice se puede utilizar para obtener un índice de marco de datos de pandas. Se devuelve un objeto de lista de índice que contiene el índice de DataFrame utilizando DataFrame.propiedad índice.
Sintaxis:
pandas.Índice (data = none, dtype = none, copy = false, name = none, tupleize_cols = true, ** kwargs)Dónde:
datos: como una matriz (unidimensional)
dtype: Numpy dtype. Es 'objeto' de forma predeterminada. Elegiremos el dtype que sea adecuado para los datos si dtype es "ninguno". Si se especifica y es seguro un dtype, Dtype se coaccionará. Si no, se mostrará una advertencia.
Copiar: bool. Se hará una copia del ndarray dado.
nombre: objeto. El nombre que se almacena en el índice.
Tupleize_Cols: bool. Por defecto, es cierto. Si es cierto, intentará crear un multiíndex.
Los métodos para obtener el índice del marco de datos se demuestran en los ejemplos a continuación.
Ejemplo # 01: Extraiga el índice de fila DataFrame utilizando la propiedad NDEX
Creemos un marco de datos, primero, con múltiples filas para que podamos demostrar cómo obtener su índice de fila utilizando la propiedad del índice PANDAS. Antes de crear DataFrame, importaremos el módulo pandas para usar sus funciones.
importar pandas como PDMediante el uso de una lista dentro del PD.Función DataFrame (), hemos creado nuestro DataFrame. Hay dos columnas en nuestro marco de datos: nombre y edad. La columna 'Nombre' está almacenando los nombres de algunas personas al azar ('Tyson', 'Jack', 'Bruce', 'Peter', 'Nick', 'Haris', 'Randy')). Mientras que la columna 'edad' consiste en las edades de cada persona (23, 25, 25, 24, 21, 26, 25). Al comienzo de cada fila, hay un valor de índice para cada fila creado por el constructor pandas de forma predeterminada. Ahora, usaremos la propiedad de índice para extraer esta columna de índice.
df.índiceLa salida muestra que las filas están comenzando desde 0, incrementando en 1 y terminando en el índice antes de las 7.
Para imprimir cada valor de índice, podemos usar un iterador y dentro de él o la función imprimir ().
i = df.índiceAhora, hemos impreso todos los valores del índice 0 al 7.
Ejemplo # 02: Extraiga el índice de fila de marco de datos utilizando una condición
Los valores de índice se pueden recuperar especificando una condición. La propiedad de índice obtendrá los valores de índice del marco de datos que satisface la condición especificada. Luego, usaremos la función tolist () para devolver los valores obtenidos como una lista. Usando el PD.Función DataFrame (), primero creemos nuestro DataFrame.
importar pandas como PDMediante el uso de un diccionario de Python dentro del PD.Función DataFrame (), hemos creado un DataFrame. Nuestro marcado de datos consta de tres columnas y 8 filas de 0 a 7. La columna 'elementos' está almacenando los valores de datos como cadena ('a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'). El 'precio' de la columna contiene los valores numéricos que representan la pieza de cada artículo (100, 200, 150, 100, 200, 320, 100, 100). El código de columna que tiene los valores de datos ('Q', 'W', 'E', 'R', 't', 'y', 'u', "). Ahora, recuperemos los valores de índice utilizando el script a continuación.
i = df.índiceUsando la propiedad de índice, hemos recuperado los índices 'DF' DataFrame. Luego, hemos especificado una condición para extraer datos donde los valores en la columna de precios son iguales a 100. Después de obtener los datos, obtuvimos los valores de índice de filas que están satisfaciendo la condición especificada. Al final, la función tolist () se usa para transformar la salida en un objeto de lista. La función ha recuperado una lista con cuatro valores de índice, [0, 3, 6, 7].
Ejemplo # 03: Extraiga el índice de columna DataFrame usando la función get_loc ()
Hemos visto cómo recuperar los valores de los índices de fila de DataFrame. Sin embargo, también podemos recuperar los valores de los índices de columna de DataFrame. Para obtener el valor de índice de cualquier columna de DataFrame, se puede usar la función get loc (). Para encontrar el índice, simplemente suministramos la etiqueta de columna a la función get_loc (). Creemos un marco de datos que consta de más de una columna para que podamos recuperar su ubicación de índice o valor de índice.
importar pandas como PDEn nuestro marco de datos, hemos creado cuatro columnas: clase, miembros, salario y gasto. La columna de clase almacena los valores de datos ('a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'). Los miembros de la columna contienen valores (5, 4, 5, 5, 4, 6, 4, 4), mientras que el salario y el gasto de la columna contienen los valores de datos numéricos (30000, 28000, 32000, 31000, 30000, 26000, 27000, 28000 ) y (12000, 11000, 11500, 13000, 10000, 12500, 10500, 13000), respectivamente. Supongamos que tenemos que encontrar el valor de índice del salario de la columna:
df.columnas.get_loc ("salario")La función ha recuperado el índice de la columna especificada, 2.
Ejemplo # 04: Extraiga los valores de índice de fila especificados usando la función get_loc ()
También podemos recuperar la ubicación del índice de los índices de fila utilizando la función get_loc () si se especifican las etiquetas para los índices de fila. Podemos especificar las etiquetas en nuestro índice de fila utilizando una lista que contiene nombres para cada valor del índice de fila. Agreguemos las etiquetas de índice a DataFrame que hemos creado en el Ejemplo # 3.
importar pandas como PDDentro de pd.Marco de datos() función, hemos especificado el parámetro del índice como una lista que contiene etiquetas de R1 a R8. Las etiquetas 'R1', 'R2', 'R3', 'R4', 'R5', 'R6', 'R7' y 'R8' han reemplazado el índice entero predeterminado de DataFrame. Ahora, recuperemos la ubicación del índice para una etiqueta específica.
Imprimir (DF.índice.get_loc ("R5"))Primero, la propiedad de índice se aplica a DataFrame para obtener los índices. Entonces, get_loc () La función se aplica para extraer la posición de índice de la etiqueta de índice especificada de la fila.
Ejemplo # 05: Extraiga los valores del índice de fila usando la función Numpy donde ():
También podemos obtener los valores de índice especificando una condición dentro del dónde() función de numpy. Creemos primero un marcado de datos, importaremos los pandas y la biblioteca Numpy para usar sus funciones.
importar pandas como PDDespués de importar las bibliotecas requeridas, hemos creado nuestro marco de datos. En nuestro DataFrame, tenemos tres columnas (ID, precio y descuento). La identificación de columnas, el precio y el descuento almacenan los valores de datos ('001', '002', '003', '004', '005', '006', '007', '008'), (100, 150 , 130, 200, 120, 170, 120, 140), y (30, 40, 10, 20, 60, 10, 30, 60), respectivamente. Ahora, encontremos el valor del índice de fila usando el dónde() función dentro de la función list ().
Lista (NP.donde (df ["descuento"]> 30))Hemos especificado una condición dentro de la función Where () para obtener las filas donde el valor en la columna 'descuento' es mayor que 30. Para crear una lista de los valores devueltos, hemos utilizado el método list ().
Conclusión
Este artículo cubrió cómo recuperar los valores del índice de marco de datos en pandas. Utilizamos diferentes funciones para recuperar el índice de fila y columna del marco de datos. Implementamos múltiples ejemplos para enseñarle cómo extraer el índice DataFrame de fila utilizando la propiedad de índice, utilizando condiciones y utilizando la función get_loc (). Además, hemos discutido cómo obtener valores de índice de columna usando la función get_loc ().