Python CSV Skip Header Fila

Python CSV Skip Header Fila
En este artículo, aprenderemos cómo podemos eliminar el encabezado de los datos del archivo CSV mientras lee el CSV en sí porque a veces no necesitamos el encabezado de los datos del archivo CSV. Así que vamos a aprender estos cuatro métodos, que se dan a continuación:
  1. Usando el método Next ()
  2. Use el método Dictreader ()
  3. Pandas Skipows basados ​​en un número de fila específico
  4. Pandas saltos basados ​​en una posición de índice

Expliquemos cada uno de los métodos anteriores en detalle.

Método 1: Uso del método Next ()

En este método, usaremos el método Next () y veremos cómo este método descartará la fila del encabezado antes de imprimir todos los demás datos de CSV.

Archivo CSV: El archivo CSV a continuación (prueba.CSV) usaremos para este blog.

Mes, 1958,1959,1960
Enero, 340,360,417
Febrero, 318,342,391
Mar, 362,406,419
Abr, 348,396,461
Enero, 340,360,417
Feb, 318,342,391 importación CSV
con abierto ("Prueba.csv "," r ") como registro:
# Estamos creando un objeto del lector CSV
csvreader_object = CSV.Lector (registro)
# La línea se omitirá la primera fila del archivo CSV (fila de encabezado)
Next (csvreader_object)
# Ahora estamos imprimiendo todas las filas, excepto la primera fila del CSV
para fila en csvreader_object:
Imprimir (fila)

Producción:

['Jan', '340', '360', '417']
['Feb', '318', '342', '391']
['Mar', '362', '406', '419']
['Apr', '348', '396', '461']
['Jan', '340', '360', '417']
['Feb', '318', '342', '391']

Línea 1: importamos el módulo CSV.

Línea 3-7: Abrimos la prueba.Archivo CSV en modo de lectura ('R') como un registro, y luego creamos un objeto del CSV.Método Reader (). El método siguiente (), cuando lo llamamos, descarta automáticamente la primera fila del objeto del lector CSV y el resto de los datos que podemos usar como necesitamos.

Líneas 10-11: Ahora, estamos iterando el objeto del lector CSV e imprimiendo cada fila. La salida anterior muestra que ahora no hay fila de encabezado.

Método 2: Uso del método Dictreader ()

Ahora, veremos cómo podemos leer el CSV como formato de diccionario. Pero después de leer el archivo CSV como un formato directo, imprimiremos solo el valor, no la clave, que resolverá nuestro problema de imprimir todos los datos sin la fila del encabezado. Estamos usando la misma prueba.archivo csv como usamos antes. A continuación se da un ejemplo de este método:

Importar CSV
con abierto ("Prueba.csv "," r ") como registro:
# Estamos creando un objeto del lector CSV
csvreader_object = CSV.Dictreader (registro)
# La línea se omitirá la primera fila del archivo CSV (fila de encabezado)
# Porque funciona como un dict y estamos imprimiendo solo valores, no teclas
para fila en csvreader_object:
print (fila ["mes"], fila ["1958"], fila ["1959"], fila ["1960"])

Producción:

Jan 340 360 417
318 de febrero 342 391
Mar 362 406 419
Abr 348 396 461
Jan 340 360 417
318 de febrero 342 391

Línea 1: importamos el módulo CSV.

Línea 3 -5: Abrimos la prueba.Archivo CSV en modo de lectura ('R') como un registro, y luego creamos un objeto del CSV.Método Dictreader ().

Líneas 8-9: Ahora, estamos iterando el objeto CSV Dictreader e imprimiendo cada fila. Pero esta línea descarta automáticamente la primera fila del objeto del lector CSV porque Dictreader convierte cada fila en un formulario de dict (clave y valor). Cuando imprimimos solo valor, no clave, que solo muestra los datos, no el K, V, que era nuestro objetivo principal.

Método 3: Uso de los atributos de pandas read_csv skiprows

En este método, vamos a usar los skiprows de atributo Pandas Read_CSV. En el omisión, mencionaremos el número de la fila de encabezado, que obviamente es 1, por lo que definimos el valor de los omitidos como 1 como se muestra en el siguiente programa. De esta manera, podemos ignorar la fila de encabezado del CSV mientras lee los datos.

importar pandas como PD
Skipheaderdf = PD.read_csv ('prueba.CSV ', Skiprows = 1)
Imprimir (Skipheaderdf)

Producción:

Jan 340 360 417
0 Feb 318 342 391
1 mar 362 406 419
2 de abril 348 396 461
3 de enero 340 360 417
4 de febrero 318 342 391

Línea 1: Importamos la biblioteca de pandas como PD.

Línea 2: Leemos el archivo CSV usando el módulo Pandas Read_CSV, y en eso, mencionamos el SkipRows = 1, lo que significa omitir la primera línea mientras lee los datos del archivo CSV.

Línea 4: Ahora, imprimimos el resultado final de DataFrame que se muestra en la salida anterior sin la fila de encabezado.

Método 4: Usando pandas, retire el encabezado del CSV usando la posición de índice

En este método, vamos a usar los skiprows de atributo Pandas Read_CSV. En el omisión, mencionaremos el número de posición del índice del encabezado, que obviamente es 0, por lo que definimos el valor de los omitidos en los soportes cuadrados ([0]) como se muestra en el siguiente programa. De esta manera, podemos ignorar la fila de encabezado del CSV mientras lee los datos.

importar pandas como PD
Skipheaderdf = PD.read_csv ('prueba.CSV ', Skiprows = [0])
Imprimir (Skipheaderdf)

Producción:

Jan 340 360 417
0 Feb 318 342 391
1 mar 362 406 419
2 de abril 348 396 461
3 de enero 340 360 417
4 de febrero 318 342 391

Línea 1: Importamos la biblioteca de pandas como PD.

Línea 2: Leemos el archivo CSV usando el módulo Pandas Read_CSV, y en eso, mencionamos el SkipRows = [0], que significa omitir la primera línea mientras lee los datos del archivo CSV.

Línea 4: Ahora, imprimimos el resultado final de DataFrame que se muestra en la salida anterior sin la fila de encabezado.

Conclusión:

Este artículo ha visto cuatro métodos diferentes para omitir la fila de encabezado mientras lee el archivo CSV. Todos los métodos en el artículo anterior están perfectamente bien y son utilizados por el programador de Python para omitir el encabezado del archivo CSV mientras lee los datos de CSV. El método de la biblioteca de pandas no solo nos permite eliminar el encabezado de los datos del archivo CSV, sino que también se puede usar para eliminar otras filas si especificamos su número o posición de índice a los Skiprows. Entonces, los Skiprows podrán eliminar todas esas filas cuyos números se les asignarán. Por lo tanto, el módulo pandas para omitir el encabezado es el mejor para usar, y también es muy conveniente para eliminar las otras filas.

Los otros métodos que usan el Dictreader y el lector también están disponibles, pero estos son solo para las filas de encabezado, por lo que si queremos eliminar algunas otras filas, también tenemos que escribir algún otro código también.