¿Qué es Amazon EMR??
El usuario puede poner todos los datos en un almacén de datos para procesarlos con su elección de marcos de procesamiento distribuido como Hadoop, Hive, etc. Amazon S3 es, con mucho, el mejor almacenamiento de datos, sin embargo, las organizaciones han encontrado a Spark y Hadoop difícil y costoso de configurar. Amazon EMR se puede usar para crear grupos utilizando aplicaciones como Spark o Hadoop y analizar Big Data en la nube:
Características
Algunas de las características clave del EMR se mencionan a continuación:
Elástico: El usuario puede crear múltiples grupos en EMR y también el servicio permite cambiar el tamaño de estos grupos para que su elasticidad sea su característica importante:
Tiendas de datos flexibles: Amazon EMR Cluster es muy flexible cuando se trata de instalaciones de almacenamiento de datos y se integra bien con otros servicios de AWS:
Herramientas: EMR proporciona múltiples herramientas para que los usuarios creen y usen sus grupos en la nube:
Cómo usar EMR?
Para usar el servicio EMR del AWS, simplemente diríjase al tablero de EMR y seleccione "Racimos"Desde el panel izquierdo y haga clic en el"Crear clúster" botón:
Escriba el nombre del clúster y seleccione el "Aplicaciones"Para el clúster:
Desplácese hacia abajo en la página y seleccione el tipo de tipo de instancia y el archivo de pares de teclas para configurar la configuración de hardware y seguridad. Revise las configuraciones y haga clic en el "Crear clústerBotón para completar el proceso:
El clúster EMR se mostrará en su página:
Has creado con éxito un clúster EMR en AWS.
Conclusión
Amazon EMR se usa para crear grupos utilizando aplicaciones como Hadoop, Spark, etc., y crear instancias de EC2 a través de él. EMR tiene las características de elasticidad y flexibilidad de la escalabilidad del clúster con el almacenamiento seguro de datos en la nube. El usuario puede crear un clúster EMR desde la plataforma AWS y conectarse a él utilizando la aplicación de masilla.