Cómo leer el archivo de Excel en Python

Cómo leer el archivo de Excel en Python

El .xlsx es la extensión del documento de Excel que puede almacenar una gran cantidad de datos en forma tabular, y muchos tipos de cálculo aritmético y lógico se pueden hacer fácilmente en una hoja de cálculo de Excel. A veces se requiere leer los datos del documento de Excel utilizando el script de Python para fines de programación. Existen muchos módulos en Python para leer el documento de Excel. Algunos de los módulos útiles son xlrd, OpenPyxl, y pandas. Las formas de usar estos módulos para leer el archivo de Excel en Python se han mostrado en este tutorial.

Requisito previo:

Un archivo de Excel ficticio con el .Se requerirá la extensión XLSX para verificar los ejemplos de este tutorial. Puede usar cualquier archivo de Excel existente o crear uno nuevo. Aquí, un nuevo archivo de Excel llamado ventas.xlsx El archivo ha sido creado con los siguientes datos. Este archivo se ha utilizado para leer utilizando diferentes módulos de Python en la siguiente parte de este tutorial.

ventas.xlsx

Fecha de venta Vendedor Cantidad
12/05/18 Sila Ahmed 60000
12/06/19 Mir Hossain 50000
09/08/20 Sarmin jahan 45000
07/04/21 Mahmudul Hasan 30000

Ejemplo-1: lea el archivo de Excel usando XLRD

El módulo XLRD no está instalado con Python de forma predeterminada. Entonces, debe instalar el módulo antes de usarlo. La última versión de este módulo no admite el archivo de Excel con el .extensión XLSX. Entonces, debes instalar el 1.2.0 versión de este módulo para leer el archivo XLSX. Ejecute el siguiente comando desde el terminal para instalar la versión requerida de xlrd.

$ Pip Install xlrd == 1.2.0

Después de completar el proceso de instalación, cree un archivo de Python con el siguiente script para leer el ventas.xlsx archivo usando el xlrd módulo. Open_Workbook () la función se usa en el script Abra el archivo XLSX para leer. Este archivo de Excel contiene una sola hoja. Entonces el libro de trabajo.sheet_by_index () la función se ha utilizado en el script con el valor del argumento 0. A continuación, los anidados 'para' El bucle ha usado para leer los valores de la celda de la hoja de trabajo utilizando los valores de fila y columna. Se han utilizado dos funciones de rango () en el script para definir el tamaño de la fila y la columna en función de los datos de la hoja. El Cell_Value () La función ha utilizado para leer el valor de celda particular de la hoja en cada iteración del bucle. Cada campo en la salida se separará por un espacio de pestaña.

# Importar el módulo XLRD
importar xlrd
# Abra el libro de trabajo
Libro de trabajo = xlrd.Open_WorkBook ("Ventas.xlsx ")
# Abra la hoja de trabajo
hoja de trabajo = libro de trabajo.sheet_by_index (0)
# Itera las filas y columnas
para i en el rango (0, 5):
para j en rango (0, 3):
# Imprima los valores de la celda con el espacio de pestaña
Imprimir (Hoja de trabajo.Cell_value (i, j), end = '\ t')
imprimir(")

Producción:

La siguiente salida aparecerá después de ejecutar el script anterior.

Ejemplo-2: lea el archivo de Excel usando OpenPyxl

El OpenPyxl es otro módulo de Python para leer el archivo XLSX, y tampoco está instalado con Python por defecto. Ejecute el siguiente comando desde el terminal para instalar este módulo antes de usarlo.

$ Pip Instalar OpenPyxl

Después de completar el proceso de instalación, cree un archivo de Python con el siguiente script para leer el ventas.xlsx archivo. Como el módulo XLRD, el openpyxl El módulo tiene el load_workbook () función para abrir el archivo xlsx para leer. El ventas.xlsx El archivo se usa como el valor de argumento de esta función. El objeto del Wookbook.activo se ha creado en el script para leer los valores del max_row y el max_column propiedades. Estas propiedades se han utilizado en los bucles anidados para leer el contenido del ventas.xlsx archivo. La función de rango () se ha utilizado para leer las filas de la hoja, y la función iter_cols () se ha utilizado para leer las columnas de la hoja. Cada campo en la salida estará separado por dos espacios de pestaña.

# Importar módulo OpenYXL
importar openpyxl
# Definir variable para cargar el Wookbook
Wookbook = OpenPyxl.load_workbook ("Ventas.xlsx ")
# Definir variable para leer la hoja activa:
hoja de trabajo = Wookbook.activo
# Iterar el bucle para leer los valores de la celda
para i en rango (0, hoja de trabajo.max_row):
para col en la hoja de trabajo.iter_cols (1, hoja de trabajo.max_column):
Imprimir (col [i].valor, end = "\ t \ t")
imprimir(")

Producción:

La siguiente salida aparecerá después de ejecutar el script anterior.

Ejemplo-3: lea el archivo de Excel usando pandas

El módulo pandas no está instalado con python, el módulo anterior. Entonces, si no lo instaló antes, entonces debe instalarlo. Ejecute el siguiente comando para instalar el pandas del terminal.

$ PIP Install Pandas

Después de completar el proceso de instalación, cree un archivo de Python con el siguiente script para leer el ventas.xlsx archivo. El read_excel () La función de los pandas se usa para leer el archivo XLSX. Esta función se ha utilizado en el script para leer el ventas.xlsx archivo. El Marco de datos() La función se ha utilizado aquí para leer el contenido del archivo XLSX en el marco de datos y almacenar los valores en la variable nombrada datos. El valor de los datos se ha imprimido más tarde.

# Pandas de importación
importar pandas como PD
# Cargue el archivo XLSX
Excel_data = PD.read_excel ('ventas.xlsx ')
# Lea los valores del archivo en DataFrame
datos = PD.DataFrame (Excel_Data, Columns = [
'Fecha de ventas', 'Venta', 'cantidad'])
# Imprime el contenido
imprimir ("El contenido del archivo es: \ n", datos)

Producción:

La siguiente salida aparecerá después de ejecutar el script anterior. La salida de este script es diferente de los dos ejemplos anteriores. Los números de fila se imprimen en la primera columna, donde el valor de fila se ha contado a partir de 0. Los valores de la fecha están alineados centralmente. Los nombres de los vendedores están alineados correctamente. La cantidad está alineada a la izquierda.

Conclusión:

Los usuarios de Python deben trabajar con archivos XLSX para diferentes fines de programación. Se han mostrado tres formas diferentes de leer el archivo XLSX en este tutorial utilizando tres módulos de Python. Cada módulo tiene diferentes funciones y propiedades para leer el archivo XLSX. Este tutorial ayudará a los usuarios de Python a leer el archivo XLSX fácilmente usando el script de Python después de leer este tutorial.