Python Leer CSV en una matriz 2D

Python Leer CSV en una matriz 2D
Como sabemos, cuando hablamos de la matriz 2D, estamos hablando de la matriz numpy. La matriz Numpy es utilizado básicamente por informáticos e ingenieros de aprendizaje automático para lidiar con las enormes cantidades de datos almacenados en el archivo CSV. Como resultado, Numpy les permite procesar grandes cantidades de datos en un archivo CSV de una manera muy conveniente. Python también ayuda de la misma manera al proporcionar diferentes métodos para leer los datos del archivo CSV en una matriz Numpy. Entonces, vamos a aprender sobre estos diferentes tipos de métodos en este artículo.
  1. Uso del método Numpy LoadTxt ()
  2. Uso del método Numpy GenFromTxt ()
  3. Uso de Pandas DataFrame
  4. Uso de la estructura de datos de la lista
  5. Uso del método Pandas DataFrame Values ​​()

¿Qué es un archivo CSV??

Un CSV es un archivo (valores separados por coma) en el que los datos están en forma de un tabular. La extensión del archivo CSV es .CSV. Este archivo CSV se usa principalmente en el análisis de datos. Además del análisis de datos, el archivo CSV también se usa en la aplicación de comercio electrónico porque es muy fácil de manejar en todos los diferentes tipos de lenguajes de programación.

Método 1: Uso del método Numpy LoadTxt ()

En este método, vamos a usar el Numpy.Método LoadTxt () que convierte los datos de CSV en una matriz 2D. El siguiente es un archivo CSV de muestra que utilizaremos en este programa.

1,2
3,4
5,6
7,8
9,10

Código de Python:

importar numpy como np
Csvdata = open ("SampleCSV.CSV ")
Array2d_result = np.loadTxt (csvdata, delimiter = ",")
imprimir (array2d_result)

Producción:

[[1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]

Línea 1: Importamos la biblioteca numpy.

Línea 3-4: Abrimos el archivo SampleCSV y pasamos tanto CSVData como el delimitador a NP.función loadTxt (), que devuelve los datos a una matriz 2D.

Línea 6: Finalmente imprimimos el resultado que muestra que ahora nuestros datos de CSV se convierten en una matriz 2D.

Método 2: usando el método Numpy GenFromTxt ()

En este método, vamos a usar el Numpy.Método GenFromTxt () que convierte los datos de CSV en una matriz 2D. El siguiente es un archivo CSV de muestra que utilizaremos en este programa.

1,2
3,4
5,6
7,8
9,10

Código de Python:

importar numpy como np
Csvdata = open ("SampleCSV.CSV ")
Array2d_result = np.GenFromTxt (CSVData, Delimiter = ",")
imprimir (array2d_result)

Producción:

[[1. 2.]
[3. 4.]
[5. 6.]
[7. 8.]
[9. 10.]

Línea 1: Importamos la biblioteca numpy.

Línea 3-4: Abrimos el archivo SampleCSV y pasamos tanto CSVData como el delimitador a Numpy NP.Función GenFromTxt (), que devuelve los datos a una matriz 2D.

Línea 6: Finalmente imprimimos el resultado que muestra que ahora nuestros datos de CSV se convierten en una matriz 2D.

Método 3: Uso de Pandas DataFrame

En este método, vamos a usar los pandas que convierte los datos de CSV en una matriz 2D. A continuación se muestra un archivo CSV de muestra que utilizaremos en este programa.

1,2
3,4
5,6
7,8
9,10 Pandas de importación como PD
DF = PD.read_csv ('samplecsv.CSV ')
Imprimir (DF)
Array2d_result = df.to_numpy ()
imprimir (array2d_result)

Producción:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Línea 1: Importamos la biblioteca de pandas como pd.

Línea 2-3: Leemos el archivo CSV utilizando el método Pandas Read_CSV y luego imprimimos el DataFrame (DF) recién creado en la pantalla como se muestra en la salida anterior.

Línea 4-5: Luego usamos el método DataFrame a_numpy que convierte los valores completos de DataFrame en una matriz 2D como se muestra en la salida.

Método 4: Uso de la estructura de datos de la lista

En este método, vamos a utilizar la estructura de datos de la lista. La lista también puede ayudarnos a poner los datos de CSV en una matriz 2-D. El siguiente programa demuestra el mismo método.

Importar CSV
importar numpy
con abierto ("SampleCSV.csv ", newline =") como archivo:
result_list = list (CSV.Lector (archivo))
imprimir (result_list)
result_2d = numpy.Array (result_list)
imprimir (result_2d)

Producción:

[['' 1 ',' 2 '], [' 3 ',' 4 '], [' 5 ',' 6 '], [' 7 ',' 8 '], [' 9 ',' 10 ']] ]
[['1' '2']
['3' '4']
['5' '6']
['7' '8']
['9' '10']]

Línea 1: Importamos las bibliotecas CSV y Numpy.

Líneas 3-5: Abrimos el archivo SampleCSV y luego leemos los datos de cada archivo CSV utilizando el CSV.Método de Reader () y convertir los resultados en una lista de listas.

Línea 6: Ahora, usamos el Numpy.Método de matriz para convertir toda la lista de listas en una matriz 2-D. El resultado en la salida muestra que nuestros datos de CSV ahora se han convertido con éxito en una matriz 2-D.

Método 5: Uso de los valores de marcado de datos PANDAS

En este método, vamos a utilizar el método muy básico para convertir los datos de CSV en una matriz Numpy utilizando la función DataFrame (). El siguiente programa demostrará lo mismo.

importar pandas como PD
DF = PD.read_csv ('samplecsv.CSV ')
Imprimir (DF)
Array2d_result = df.valores
imprimir (array2d_result)

Producción:

1 2
0 3 4
1 5 6
2 7 8
3 9 10
[[3 4]
[5 6]
[7 8]
[9 10]]

Línea 1: Importamos la biblioteca de pandas como pd.

Línea 2-4: Leemos el archivo CSV utilizando el método Pandas Read_CSV y luego imprimimos el DataFrame (DF) recién creado en la pantalla como se muestra en la salida anterior.

Línea 5-6: Luego usamos la función DataFrame Values ​​() que convierte el DataFrame en una matriz 2-D Numpy como se muestra en la salida.

Conclusión

En este artículo, hemos visto diferentes métodos para leer los datos de CSV en una matriz 2D. Hemos mostrado todos los métodos utilizados actualmente por diferentes programadores e informáticos. Algunos de los métodos están incorporados, y algunos de los métodos se crean al peinar diferentes métodos de diferentes bibliotecas. Pero todos los métodos anteriores que puede usar de acuerdo con sus requisitos. Si sabe cómo leer el archivo CSV, también puede crear algunos de sus propios métodos.