Exportación de pandas a Excel

Exportación de pandas a Excel
DataFrame es el componente central en casi todas las operaciones de pandas. Por lo general, guarda datos que importa de un archivo en un objeto Pandas DataFrame. Permanece dentro del objeto DataFrame incluso después de que se apliquen las modificaciones. Para acceder a datos fuera de Python, con frecuencia puede necesitar exportarlos en un formato diferente.

En este tutorial, le explicaremos dos métodos para exportar un marco de datos de pandas en un archivo de Excel. La primera técnica implica invocar el "DF.to_excel () ”para exportar a un archivo de Excel. El "PD.El método ExcelWriter () "es el segundo enfoque cubierto en este artículo. Esta técnica escribe objetos a la hoja de cálculo de Excel y luego los exporta al archivo de Excel que utiliza el método "a Excel".

Ejemplo # 1: Utilizando Pandas DF.método to_excel ()

Para exportar DataFrame a Excel, necesitamos una biblioteca de requisitos previos "OpenPyxl". Esta biblioteca se puede instalar en el entorno Python ejecutando el comando pip "PIP install OpenPyxl".

Comenzando con el script de Python, primero cargamos la biblioteca de pandas. El módulo pandas se importa como "PD", que es el alias para pandas. Para exportar el datagrama a Excel, tenemos que crear principalmente un marco de datos. La construcción de DataFrame se puede lograr utilizando el "PD.Método DataFrame () ". El "PD.El método DataFrame () "se invoca para generar DataFrame con 3 columnas" Idioma "," Puntos "y" Proyectos ". La columna "lenguaje" está almacenando nombres de los lenguajes de programación que son "Java", "Python", "C ++", "R", "Kotlin" y "Php".

Hemos definido los valores de tipo entero para la columna "puntos" como "10", "6", "20", "15", "9" y "14". La tercera columna "proyectos" tiene un número de proyectos para cada idioma que son "11", "4", "8", "17", "6" y "5". Hemos almacenado este marco de datos en el objeto DataFrame "Prog". Para ver este marco de datos, hemos empleado el método "print ()" de Python.

Podemos ejecutar el script presionando las teclas "Enter+Shift" juntas o haciendo clic en el botón "Ejecutar archivo". La consola de Python nos muestra un marco de datos con 3 columnas y 6 filas.

El marco de datos se ha creado productivamente. Exportarlo en el archivo de Excel es la siguiente tarea. De manera predeterminada, cuando exportamos un cuadro de datos de Data a Excel/CSV, se guarda en el directorio de trabajo actual de nuestro entorno Python. También puede cambiar esta configuración proporcionando una ruta específica donde desea exportar el archivo. Trabajaremos con la configuración predeterminada en este caso.

Primero, necesitamos ver el directorio de trabajo actual de nuestro entorno. Esto se puede hacer utilizando el script de Python que se proporciona a continuación:

Aquí, hemos encontrado nuestro directorio de trabajo actual que es "Desktop". Esto significa que los archivos se exportarán al directorio de escritorio de nuestro sistema.

Ahora, para exportar el marco de datos, tenemos un método "DF.to_excel () ”proporcionado por Pandas. El método "To_excel ()" se invoca con el nombre del DataFrame que es "Prog". Entre los paréntesis de la función, hemos especificado el nombre del archivo de Excel como "MyData" con el ".extensión XLSX ”. Esto escribirá el objeto DataFrame "Prog" directamente en la hoja de Excel. El archivo de Excel se guardará en nuestro directorio de trabajo actual que ya hemos asignado como escritorio.

Cuando ejecutamos el script, el marco de datos se exportará al archivo de Excel en el escritorio. Hemos abierto el directorio de escritorio de nuestra máquina y encontramos un archivo de Excel llamado "MyData". La apertura del archivo nos muestra el marco de datos que hemos exportado al archivo "XLSX". En la instantánea adjunta aquí, puede observar que el nombre de la hoja es como especificado "MyData".

En la imagen de arriba, hemos visto que los índices se almacenan en una columna. Además, también puede eliminar las etiquetas de las columnas. Esto se puede hacer simplemente utilizando dos parámetros "índice" y "encabezado".

Por defecto, los parámetros de "índice" y "encabezado" se establecen en "verdadero". Cuando no los queremos, simplemente cambiamos la configuración predeterminada a "falso" para ambos argumentos.

Aquí, tenemos nuestro archivo de Excel sin una columna de índice y los títulos de las columnas.

Ejemplo # 2: Utilización de Pandas PD.Método Excelwriter ()

Esta demostración le enseñará otro método para exportar un marco de datos de pandas en un archivo de Excel.

El programa iniciado importando el kit de herramientas Pandas en el archivo de Python. Las funciones de Pandas son accesibles para nosotros en el archivo de Python ahora. Para exportar un marco de datos a Excel, primero debemos tener uno. El marco de datos se genera utilizando los pandas "PD.Función DataFrame () ". Invocamos el "PD.Método DataFrame () "e inicializó DataFrame con 4 columnas. Las etiquetas de la columna son "STD_ID", "Economía", "Geografía" e "Historia".

La columna "STD_ID" está almacenando las ID de los estudiantes como "1011", "1012", '1013 "," 1014 "y" 1015 ". Las marcas de 3 sujetos se almacenan en columnas "Economía" que tienen valores "98", "60", "70", "65", 87 "; "Geografía" de los valores de retención "51", "78", "88", "97" y "56"; e "Historia" que lleva estas entradas "56", "76", "78", "65" y "79". Todas estas columnas deben tener que tener la misma longitud de valores.

En nuestra ilustración, el tamaño de la columna es 5. El "PD.Método DataFrame () "Cuando se le llame para crear un marco de datos con estos valores, requiere un objeto donde pueda almacenar el DataFrame para que podamos volver a él más tarde. Hemos creado un "informe" del objeto DataFrame y lo asignamos la salida de llamar al "PD.Método DataFrame () ". Para ver el marco de datos en la pantalla, hemos empleado la función "print ()".

El marco de datos recién creado con 4 columnas se ha exhibido en la consola de Python.

Ahora veremos cómo guardar este marco de datos en un archivo de Excel que utiliza pandas "PD.Método Excelwriter () ". El "PD.La función ExcelWriter () "se invoca y entre sus paréntesis, hemos definido el nombre del archivo de Excel con el".Extensión de XLSX "como" tarjeta de informes.xlsx ". Se construye una variable "tienda" para almacenar el resultado de "PD.Excelwriter () "que será un archivo de Excel. Ahora, tenemos una hoja de Excel con el nombre "informa.xlsx ". Exportaremos el marco de datos ahora ahora.

Para esto, el método pandas "df.to_excel () "se llama. El nombre del "informe" de DataFrame se adjunta con el ".método to_excel () ". La variable "tienda", que tiene un archivo de Excel, se pasa como parámetro. Entonces, el marco de datos se exportará en la "tarjeta de informes.archivo xlsx ". Para guardar el contenido de la tabla, tenemos un método "DF.ahorrar()". Se emplea el método "save ()" y el marco de datos se guarda con éxito en el archivo de Excel. Tenga en cuenta que este archivo se guardará en el directorio de trabajo actual de nuestro proyecto, que en este caso es el directorio "Desktop".

La "tarjeta de informes.El archivo XLSX "se encuentra en el directorio de escritorio de nuestra máquina. Se inicia el archivo y aquí vemos que el marco de datos que creamos se almacena en este archivo.

Conclusión

Este artículo lo familiarizó con dos estrategias para lograr el resultado deseado. Se han discutido los dos métodos de pandas. La demostración práctica de códigos de ejemplo para emplear ambos métodos se ha llevado a cabo en la herramienta Spyder. El primer ejemplo usó el "DF.método to_excel () "para exportar el marco de datos en un archivo de Excel mientras la segunda ilustración elaboró ​​en el" PD.Método ExcelWriter () "para almacenar el marco de datos en una hoja de Excel.