Cómo crear trabajo ETL en AWS Glue

Cómo crear trabajo ETL en AWS Glue

AWS Glue es un servicio informático sin servidor de AWS, muchas empresas comenzaron a usarlo para la inteligencia empresarial y la integración de datos. AWS Glue también se usa para crear, administrar y ejecutar el trabajo ETL Job, ETL (Extract, Transform y Load) es un proceso para mover datos de la base de datos de origen a la base de datos de destino.

Esta publicación proporcionará una guía de procedimiento para crear un trabajo de ETL en AWS Glue.

Crea un trabajo de ETL en AWS Glue

En la consola de administración de Amazon, busque AWS Glue y haga clic en él:

Haga clic en trabajos:

El siguiente paso es elegir el método de creación de empleo, en esta publicación vamos a Seleccione un visual con una fuente y destino y seleccione Fuente y destino:

Haga clic en el trabajo de ETL:

Seleccione la fuente y proporcione el tipo de fuente S3, URL S3 y formato de datos:

Seleccione el cubo de destino S3 y proporcione el formato, el tipo de compresión y la ubicación de destino S3:

Seleccione la pestaña Detalles del trabajo y elija el rol de IAM:

Deje la otra opción como predeterminado y haga clic en Guardar:

Aparecerá un mensaje de éxito:

Ejecutar el trabajo de ETL en AWS Glue

Haga clic en el Correr botón:

Aparecerá un mensaje de éxito en la pantalla una vez que se inicie el trabajo:

Vaya a la pestaña Ejecutar, para ver si el estado ETL Job Ejecita:

Detener el trabajo de ETL en AWS Glue

Para detener el trabajo de ETL en la pestaña Ejecutar, haga clic en el trabajo de parada correr botón:

El estado del trabajo cambiará como se detiene:

Eliminar el trabajo de ETL en AWS Glue

Haga clic en la lista desplegable Acción y seleccione la opción Eliminar:

Clickea en el Borrar botón:

Aparecerá un mensaje de éxito una vez que el trabajo elimine:

Un trabajo se elimina con éxito.

Conclusión

Para crear un trabajo de ETL en AWS, vaya a AWS Glue y seleccione trabajos, elija el método para crear un trabajo, proporcionar los detalles requeridos de la base de datos de origen y la base de datos de destino, y haga clic en el botón Guardar para crear un trabajo ETL. Después de crear el trabajo de ETL, puede ejecutar, detener y eliminar el trabajo fácilmente.