Pandas select fila por índice

Pandas select fila por índice
La selección de filas de un marco de datos podría ser necesaria para una variedad de tareas de análisis de datos. Al seleccionar ciertas filas y volver a muestrear los datos y series de datos de Pandas, se emplea la técnica de pandas "Iloc []" para la indexación basada en enteros.

Puede usarlo siguiendo la sintaxis dada:

Solo las entradas con valor entero son manejados por la propiedad "Iloc []". Sin embargo, estas entradas se pueden pasar de varias maneras.

Aprenderá varios enfoques para subestimar los marcos de datos de Pandas utilizando la propiedad "Iloc []" en este tutorial.

Ejemplo 1:

Para seleccionar una sola fila en DataFrame por índice, analizaremos la demostración práctica del "DF.Método de ILOC [] "proporcionado por Pandas.

La compilación y la ejecución de los ejemplos se llevarán a cabo en la herramienta "Spyder". Entonces, lanzamos la herramienta y buscamos las bibliotecas requeridas. Hemos descubierto que el kit de herramientas "pandas" es lo que necesitamos trabajar con métodos para seleccionar las filas. La biblioteca Pandas se importa al programa y "PD" se establece como su alias. Donde sea en el código, necesitamos llamar a Pandas, usar "PD" en lugar de "Pandas".

El primer uso del kit de herramientas de pandas viene cuando tenemos que generar un marco de datos de pandas utilizando el "PD.Método DataFrame () ". Llamamos al "PD.Función dataFrame () "y especifique valores para ella. Queríamos que creara un marco de datos que tenga 3 columnas: "Montañas", "Altitud" y "Continente". Los valores se han identificado para cada columna y la longitud de la columna se mantiene igual para todas las columnas.

La columna "Montañas" está sosteniendo los nombres de las cadenas montañosas que son "Karakoram", "Hindu Kush", "Alaska Range", "Himalayas" y "Andes". La segunda columna "altitud" almacena la longitud en los metros de estas cadenas montañosas. Los valores para esta columna son "8611", "7708", "6194", "8848" y "6961". La última columna "Continente" es tener el nombre del continente donde se encuentran estas montañas: "Asia", "Asia", "N_america", "Asia" y "S_america".

El constructor DataFrame, cuando se llama, crea un marco de datos con datos suministrados. Pero si lo llamamos nuevamente en el mismo programa con nuevos datos, perderá el anterior. Esto se debe a que no encuentra ningún almacenamiento para poner el marco de datos en. Estamos obligados a crear un espacio para preservarlo. Para contener el DataFrame para poder usarlo después, hemos creado un objeto DataFrame "hechos". Almacenará el marco de datos con columnas y filas especificadas.

Para mostrar el resultado, Python nos da un método simple que es el método "print ()". Solo toma la entrada y la exhibe en la terminal. La entrada puede ser una función, una variable/objeto, una operación matemática o una cadena para mostrar. Dado que queremos mostrar nuestro DataFrame recién creado, proporcionamos el objeto DataFrame "hechos" como la entrada al método "print ()" de Python.

Para ejecutar el script, hemos presionado las teclas "Shift+Enter". Aquí está nuestro marco de datos con 3 columnas y 5 filas presentadas en el terminal que se puede ver en la instantánea a continuación.

Ahora, se explorará la recuperación de una sola fila en el marco de datos proporcionado. La selección se basa en el índice. Para esto, el Pandas DataFrame tiene la propiedad "DF.Iloc [] ". Solo los valores enteros se pueden pasar a este método para la selección.

Hemos usado el "DF.Propiedad ILOC [] "justo después de mostrar DataFrame. El nombre de nuestros "hechos" de DataFrame se proporciona con el método "ILOC []". Entre los soportes cuadrados de la propiedad, se especifica el número de índice, de la fila que queremos extraer,. Aquí hemos proporcionado el número de índice "3". Entonces, la propiedad "Iloc []" analizará el marco de datos "Hechos" y buscará la fila con el índice número 3. Coincidirá con el índice que hemos suministrado con cada índice del marco de datos y seleccionará la fila que es igual al número de índice de entrada. Después de recuperar la fila, se colocará en la variable "caja" que hemos creado para almacenar el resultado de la propiedad "Iloc []". Finalmente, el resultado se mostrará en la consola utilizando el método "print ()".

Se recupera la fila con el índice 3. Puedes verlo en la imagen a continuación. La fila con el índice número 3 tiene una montaña llamada Himalaya, la altitud es 8848 y el continente es Asia. Además, el tipo de datos para esta fila mencionado es "objeto".

Ejemplo # 2:

En la ilustración anterior, hemos aprendido a seleccionar una sola fila mediante el índice utilizando la propiedad Pandas DataFrame "Iloc []". Esta instancia hablará sobre la selección de múltiples filas en un marco de datos por índice.

Hemos empleado el "DF.propiedad de ILOC [] ”. También estamos utilizando el marco de datos creado anteriormente en este caso. El nombre de DataFrame "Hechos" está escrito con la propiedad "Iloc []" y dentro de su operador de subíndice, hemos utilizado otro soporte cuadrado para especificar múltiples índices. Si no agrega el soporte del segundo cuadrado, lanzará un error. Los índices que hemos seleccionado para mostrar son "0", "2" y "4". Entonces extraerá las filas 1, 3 y 5. El resultado se almacenará en la variable "múltiple". La función "print ()" exhibirá la salida.

Las 3 filas seleccionadas se han mostrado en la terminal.

Además de seleccionar varias filas en un marcado de datos, también puede seleccionar qué columnas se deben mostrar con las filas.

Dentro de los soportes cuadrados del método "Iloc []", hemos definido los índices para las filas y los índices de la columna que se seleccionarán. En el primer operador de subíndice, hemos mencionado índices para filas como "1", "2" y "3" e índices de columna en el segundo como "0" y "2". La salida se presenta utilizando el método "print ()".

Se han seleccionado tres filas con 2 columnas en el marco de datos resultante.

Ejemplo # 3:

La última técnica para ejercer la propiedad "Iloc []" es para seleccionar las filas por valor de índice se pondrá en práctica en este ejemplo.

Cuando se trata de seleccionar una gran cantidad de filas en un marco de datos por los valores de índice, lleva mucho tiempo especificar los índices de filas una por una, especialmente cuando se trata de grandes conjuntos de datos. Aquí la propiedad Pandas DataFrame "ILOC []" nos permite proporcionar un rango de valores.

Hemos ejercido el "DF.propiedad de ILOC [] ”con el marco de datos generado en primera instancia. El rango de valores de índice se especifica como "1: 4". Aquí "1" es el número de índice inicial y "4" es el último valor de índice. Seleccionará los valores entre este rango, incluido el valor de índice inicial, pero excluyendo el último valor de índice especificado. La variable "rango" se crea para mantener la salida ". La función "print ()" se invoca para mostrar el resultado.

Esto nos da el marco de datos que se puede ver en la imagen de salida adjunta a continuación.

Conclusión

En este artículo, hemos discutido la selección de filas en un marco de datos utilizando los valores de índice. Hemos utilizado el Pandas DataFrame "DF.propiedad de ILOC [] ”para lograr los resultados deseados. Se han explicado e implementado varias técnicas para emplear la propiedad "Iloc []" utilizando los códigos de muestra. El primer ejemplo nos dice la forma de extraer una sola fila por índice, la segunda ilustración funcionó en seleccionar múltiples filas por índice y filas seleccionadas con columnas especificadas también y la última instancia dio una idea de la entrada del rango de valores de índice.