Cómo iterar sobre las filas en un marco de datos en pandas

La iteración es un método que nos ayuda a atravesar todos los valores. En los pandas, cuando creamos un marco de datos, siempre necesitamos acceder a los valores y donde la iteración ayuda. Entonces, en este artículo, vamos a revisar diferentes métodos para la iteración de DataFrame-Wise.

pandas.Marco de datos

Se puede crear un Pandas DataFrame utilizando el siguiente constructor:

pandas.DataFrame (data = none, index = none, columns = none, dtype = none, copy = false)

Método: Uso del atributo de índice de DataFrame

Creamos un diccionario de datos con cuatro claves y luego convertimos ese diccionario de datos en DataFrame utilizando la biblioteca PANDAS como se muestra a continuación:

En el número de celda [4], solo imprimimos ese marco de datos para ver cómo se ve nuestro cuadro de datos:

En el número de celda [5], estamos mostrando qué índice real tiene información sobre el marco de datos. La salida muestra que el índice almacena los detalles de las filas totales de DataFrame en forma de rango, como se muestra arriba en la salida.

En el número de celda [6], como ya sabemos, el índice almacena la función de rango, que tiene valores de 0 a 4 (el último valor no se contó para que el bucle funcione de 0 a 3). Por lo tanto, iteramos el bucle como de costumbre, y en cada iteración, irá al nombre de la columna en particular que se menciona como df ['nombre'] y luego imprime el valor de índice particular (número de fila) de esa columna.

Método: Uso de la función LOC [] de DataFrame

Primero entendamos el método LOC e ILOC. Creamos una serie_df (serie) como se muestra a continuación en el número de celda [24]. Luego, imprimimos la serie para ver la etiqueta de índice junto con los valores. Ahora, en el número de celda [26], estamos imprimiendo la serie_df.loc [4], que da la salida c. Podemos ver que la etiqueta de índice a 4 valores es c. Entonces, obtuvimos el resultado correcto.

Ahora en el número de celda [27], estamos imprimiendo series_df.Iloc [4], y obtuvimos el resultado E que no es la etiqueta de índice. Pero esta es la ubicación del índice que cuenta desde 0 hasta el final de la fila. Entonces, si comenzamos a contar desde la primera fila, entonces obtenemos E en la ubicación del índice 4. Entonces, ahora entendemos cómo funcionan estos dos LOC e Iloc similares.

Ahora, vamos a usar el .Método LOC para iterar las filas de un marcado de datos.

En el número de celda [7], simplemente imprimimos el DataFrame que creamos antes. También vamos a usar el mismo marco de datos para este concepto.

En el número de celda [8], a medida que la etiqueta de índice comienza desde cero (0), podemos iterar cada fila y obtener los valores de la etiqueta de índice de cada columna en particular como se muestra en la imagen anterior.

Método: Uso del método itrowrows () del DataFrame

Primero entendamos el itrows () y veamos cómo imprimen los valores.

En el número de celda [32]: Creamos un DataFrame DF_TEST.

En el número de celda [33 y 35]: imprimimos nuestra df_test para que podamos ver cómo se ve. Luego, lo recorremos a través del itrows () e imprimimos la fila, que imprime todos los valores junto con los nombres de sus columnas del lado izquierdo.

En el número de celda [37], cuando imprimimos la fila usando el método anterior, obtenemos los nombres de la columna en el lado izquierdo. Sin embargo, cuando ya mencionamos el nombre de la columna, obtenemos resultados como se muestran en el número de celda [37]. Ahora entendemos claramente que iterará en cuanto a la hilera.

En el número de celda [9]: solo imprimimos el DataFrame que creamos antes. También vamos a usar el mismo marco de datos para este concepto.

En el número de celda [10]: iteraremos cada fila usando itrows () e imprimimos el resultado.

Método: Uso del método ITertUples () del DataFrame

El método anterior es similar al itrows (). Pero la única diferencia es cómo accedemos a los valores. En el número de celda [11], podemos ver que para acceder al valor de la columna en cada iteración. Estamos usando la fila. Nombre (operador de puntos).

Método: Uso de la función ILOC [] de DataFrame

Ya explicamos antes cómo el .Funciona el método ILOC. Entonces, ahora, vamos a usar ese método directamente para iterar las filas.

En el número de celda [18]: solo imprimimos el marco de datos, que creamos antes para este concepto.

En el número de celda [19]: DF.Iloc [i, 0], en el que pertenezco a la ubicación y al siguiente valor 0, que le dice el índice del nombre de la columna.

Método: iterar sobre las filas e imprima junto con los nombres de sus columnas

En el número de celda [20]: solo imprimimos el DataFrame (DF), que creamos antes para comprender el concepto.

En el número de celda [21]: iteramos a través del método ITertUples (), que ya explicamos. Pero si no mencionamos ninguna otra información, obtenemos la salida junto con sus nombres de columnas.

Conclusión:

Hoy, aprendemos diferentes métodos para remar en el marco de datos de Pandas. También aprendimos sobre .loc y .métodos de ILOC y la estrecha diferencia entre ellos. También estudiamos los métodos itrowrows () e ITertUples (). También hemos visto el método de atributo de índice. Todos estos métodos anteriores tienen sus respectivas ventajas y desventajas. Entonces, podemos decir que depende de la situación de qué método cuando tiene que usar.

OS de Windows

¿Qué es el administrador de paquetes de Windows?

Windows Package Manager o Winget es una herramienta poderosa para instalar y administrar paquetes de...

Mariana Cotto

Pitón

Matplotlib 2d histograma

En Python, el PLT.Hist2d () La función del módulo Pyplot en la biblioteca matplotlib se usa para tra...

Beatriz Enríquez

Estibador

¿Cuál es la diferencia entre Docker y Podman??

Docker utiliza una arquitectura de cliente cliente, mientras que Podman es un motor de contenedores ...

Mariana Cotto