Pandas iterar sobre filas

Pandas iterar sobre filas
A lo largo de este artículo, descubriremos varios métodos y técnicas que podemos usar para iterar sobre filas en un marco de datos de pandas.

Muestra de datos de datos

Comencemos estableciendo una muestra de datos de datos. Después de eso, siéntase libre de usar su marco de datos como mejor le.

DF = PD.Marco de datos(
'db': ['mysql', 'PostgreSQL', 'Redis', 'MongoDB', 'SQL Server']],
'Puerto': [3306, 5480, 3309, 9001, 5500],
'Registros': [12000, 2344, 4500, 90000, 1000]
)
df

El código anterior debe crear un marcado de datos simple como se muestra a continuación:

Método 1 - itera filas usando itrows ()

Los pandas nos proporcionan el método itrows () que nos permite iterar sobre las filas de un marco de datos. La función devuelve un par de índice y fila como una serie.

Podemos usar esta función para iterar sobre las filas como se muestra en el ejemplo a continuación:

Para _, fila en DF.itrowrows ():
print (f "fila \ n")

En el código de ejemplo anterior, usamos la función itrowrows () para obtener cada fila de DataFrame. El código anterior debería devolver:

Tenga en cuenta que el _ en el bucle representa el índice de la columna en DataFrame.

Método 2 - iterador de filas usando ITertUples ()

El método ItertUples () en pandas nos permite iterar sobre las hileras de un marco de datos de pandas. La función devuelve un objeto para habilitarnos iterar sobre las tuplas con nombre para cada fila en DataFrame.

La función también le permite preservar el tipo de datos mientras itera. Por lo tanto, se considera que es más rápido que itrows ().

Una ilustración de ejemplo se muestra en el siguiente código:

para fila en df.ITertUples ():
Imprimir (fila)

El código anterior debe devolver tuples para cada fila en el marco de datos. Una salida de ejemplo es como se muestra:

Para excluir el índice del resultado, podemos establecer el parámetro de índice en falso. Un ejemplo es como se muestra:

para fila en df.ITertUples (índice = falso):
Imprimir (fila)

El código anterior debería devolver:

Pensamientos

Los pandas generalmente desalientan la iteración de un marco de datos. Además, nunca modifique los datos mientras se itera a medida que la iteración devuelve una copia de los datos y no una vista.

Si está buscando modificar los datos mientras está iterando, puede optar por otras opciones como:

  1. Enumere las comprensiones
  2. Vectorización
  3. Rutinas de Cython.