Pandas obtienen índice

Pandas obtienen índice
“Encontrar los índices de fila es necesario, lo cual es crucial para la ingeniería de características. Estas habilidades pueden ayudarlo a eliminar valores atípicos o números aberrantes de un marco de datos. Una herramienta vital para obtener datos específicos o datos de columna del marco de datos PANDAS se llama índice PANDAS. Es responsable de configurar los datos para el acceso rápido y la organización. Otro nombre para el índice es la selección de subconjuntos. El valor del índice particular se conoce como etiqueta. Los valores de índice se escriben en negrita. Es posible que debamos recuperar la fila o los nombres de índice al examinar conjuntos de datos reales, que con frecuencia son muy grandes para llevar a cabo operaciones específicas. Demostraremos cómo extraer los índices de los marcos de datos de Pandas en este artículo."

Cómo obtener los índices del marco de datos en pandas?

Utilizando varias funciones y propiedades, hay varias formas de recuperar índices de DataFrame en Pandas. Explicaremos cómo extraer índices de marco de datos utilizando algunas técnicas diferentes en los siguientes ejemplos.

Primero, veremos DataFrame.propiedad índice. La propiedad de índice de un marco de datos PANDAS se utiliza para obtener el índice de fila. La etiqueta de fila de DataFrame es devuelta como un objeto por DataFrame.función de índice.

Ejemplo # 1: Obtener los índices iterando sobre los índices del marco de datos

Para extraer el índice, primero creemos un marco de datos para que podamos iterar a través de sus índices de fila. Primero debemos cargar el módulo pandas importándolo para usar sus características antes de crear el marco de datos. Crearemos nuestro marco de datos utilizando el PD.Método DataFrame ().

Se ha creado el marco de datos "DF". El "PD.El método DataFrame () ”ha tomado el diccionario de Python con claves y valores como argumento. La función print () se usa para ilustrar el marco de datos. En el marco de datos "DF", tenemos tres columnas, "Col1", "Col2" y "Col3", almacenando los valores (3, 4, 5, 6, 7, 8, 9), (9, 8, 7 , 6, 5, 4, 3) y (1, 3, 5, 7, 8, 0, 11) respectivamente. El constructor de Python crea un índice de fila entera predeterminada en el lado izquierdo de cada fila (comienza desde 0). Ahora iteremos a través de los índices para obtener los índices del marco de datos utilizando DataFrame.propiedad índice.

La propiedad de índice ha recuperado con éxito los índices del marco de datos. Como puede ver, los índices de fila en nuestro marco de datos comenzaron a las 0 y terminaron a las 6.

Ejemplo # 2: Obtener los índices como objeto de lista

Primero, crearemos un marco de datos con índices personalizados. Especificaremos las etiquetas no numéricas para los índices de fila en nuestro marco de datos.

Se puede ver que el índice de fila ya no es un índice entero, ya que hemos especificado la lista de etiquetas como ["R1", "R2", "R3", "R4", "R5", "R6", "R7 "] Al parámetro de índice de PD.Función DataFrame (). Hemos creado tres columnas "C1", "C2" y C3 "que almacenan datos ficticios (33, 45, 12, 78, 34, 86, 23), (26, 37, 76, 25, 97, 53, 31) , y (17, 74, 95, 63, 54, 56, 19) respectivamente. Ahora, usaremos la función List () para obtener la lista de etiquetas índices. Se puede crear un objeto de lista utilizando la función list (). Una colección modificable ordenada se conoce como un objeto de lista.

Dentro de la función list (), hemos utilizado la propiedad de índice para recuperar los índices del marco de datos. La función list () luego los almacena como elementos de un objeto de lista.

Ejemplo # 3: Obtener la matriz del índice utilizando el índice.Método valores ()

En este ejemplo, el índice.El método de valores se utilizará para recuperar los índices de DataFrame. Un conjunto ordenado ordenado implementado por el Ndarray inmutable llamado Pandas Index. Los nombres del eje para todos los objetos de los pandas se almacenan en este objeto básico. El índice.El atributo de valores de Pandas devuelve una matriz que contiene los datos en el objeto de índice especificado.

Hemos creado el índice personalizado definiendo una lista de etiquetas ['i', 'ii', 'iii', 'iv', 'v', 'vi', 'vii'] en el parámetro de índice. Hay tres columnas en nuestro marco de datos. La columna "x" está almacenando valores ('a', 'b', 'c', 'd', 'e', ​​'f', 'g'), columna "y" que contiene los valores de datos ('h' , 'i', 'j', 'k', 'l', 'm', 'n') y la columna "z" que tiene los valores ('o', 'p', 'q', 'r ',' s ',' t ',' u '). Ahora usaremos el índice.Método de valores para obtener los índices de DataFrame "DF".

También podemos usar la función tolist () con el índice.Método de valores para recuperar los índices de DataFrame.

Una matriz especificada se puede transformar en un objeto de lista regular con los mismos valores, elementos o elementos utilizando la función tolist ().

Ejemplo # 4: Obtener los índices utilizando los métodos de Query () y Tolist ()

Esta técnica nos permite recuperar solo los índices específicos de objetos de marco de datos PANDAS que cumplen ciertos criterios. Usando el "PD.Método DataFrame () "y el método Query () de los pandas, se creará un Pandas DataFrame en este método. Aplicando el método de consulta () a un marco de datos y pasar una condición hace que devuelva un marco de datos que solo contenga las filas que coincidan con los criterios/cumplan con la condición. Luego, usaremos el método tolist () junto con el atributo de índice, que devolverá una lista que contenga los valores de índice del marco de datos. Examinemos el código de Python utilizado para lograr esta técnica práctica para recuperar los índices del objeto DataFrame que satisface las condiciones especificadas.

Hemos creado un marco de datos que tiene etiquetas de índice como ['01', '02', '03', '04', '05', '06']. Las etiquetas de las columnas de DataFrame se especifican como "nombre", "edad" y "altura" con valores ('Alexa', 'Mark', 'Ryan', 'Bob', 'Tom', 'Joe'), (21 , 20, 21, 24, 22, 23) y (5.4, 5.8, 5.7, 6.15.9, 6.2) respectivamente.

Dentro de la función de consulta (), hemos especificado una condición para recuperar esas filas donde el valor en la columna "altura" es mayor que 5.7. Luego utilizamos el atributo de índice para extraer los índices de filas recuperadas, mientras que la función tolist () convirtió los índices devueltos en una lista i.mi. ['02', '04', '05', '06].

Ejemplo # 5: Obtener el valor de índice de la columna por la función get_loc () con el atributo de columnas

En los ejemplos anteriores, hemos visto cómo obtener índices de filas de marco de datos, pero ahora recuperaremos el valor de índice de columna de una columna específica utilizando el método get_loc () junto con el atributo de columnas. El valor de índice de un determinado nombre de la columna dentro de un marco de datos PANDAS se devolverá en este ejemplo. El atributo de columnas y la función get_loc () se utilizarán para esta tarea. El nombre de la variable que nos gusta seleccionar se especificará como un valor de cadena dentro del método Get LOC.

Mediante el uso de un diccionario de Python dentro del PD.Función DataFrame (), hemos creado nuestro DataFrame. Se puede observar que hay 5 columnas en nuestro marco de datos que tienen nombres "A", "B", "C", "D" y "E". Usemos el atributo de columna con la función get_loc () para obtener el valor de índice de la columna "D".

Para esto, pondremos el nombre de la columna, yo.mi., "D", como una cadena dentro de la función get_loc ().

La columna "D" se coloca en el valor del índice 3.

Conclusión

En este tutorial, hemos tratado de enseñar cómo puede obtener los índices del marco de datos de Pandas en Python. Hemos discutido qué índices en los pandas son y cómo puede recuperarlos utilizando diferentes funciones y atributos. Implementamos diferentes ejemplos para enseñarle cómo obtener los índices iterando a través de los índices de DataFrame, utilizando el atributo de índice, utilizando los métodos Query () y Tolist () y utilizando la función get_loc () con el atributo de columnas.