El usuario necesita las herramientas como Hadoop para almacenar, administrar y analizar Big Data of Data a escala y es difícil manejarlo. Almacenar y administrar tantos datos se pueden hacer distribuyendo en varias computadoras. Amazon proporciona el servicio EMR para administrar estos grupos en la nube sin preocuparse por los problemas de implementación, gastos y tiempo de consumo de tiempo.
Comencemos con la creación de un clúster de Hadoop con Amazon EMR.
Crear clúster Hadoop con Amazon EMR
Para crear un clúster de Hadoop con Amazon EMR, diríjase al tablero de EMR y haga clic en "Crear clúster" botón:
Escriba el nombre del nombre del clúster y seleccione las aplicaciones para el clúster EMR:
Configurar la configuración de hardware y seguridad desplazando hacia abajo en la página y luego haciendo clic en el "Crear clústerBotón para completar el proceso:
Después de eso, diríjase al tablero EC2 desde la plataforma AWS para validar las instancias creadas por el clúster EMR:
Clickea en el "Grupos de seguridad"Página desde el panel izquierdo y expandir el"Comportamiento"Pestaña para hacer clic en"Editar reglas entrantesBotón "Después de seleccionar el grupo de seguridad maestro EMR:
Agregue una regla de entrada para seleccionar un puerto SSH al que se pueda acceder desde cualquier lugar de Internet y luego haga clic en el "Guardar reglas" botón:
Nuevamente repita el paso anterior con el grupo de seguridad de esclavos EMR editando reglas entrantes:
Seleccione el puerto SSH que accederá desde cualquier lugar y luego haga clic en el "Guardar reglas" botón:
Una vez que se crea el clúster EMR, simplemente haga clic en "Habilitar una conexión SSH" enlace:
Después de eso, comienza "Masilla"Y siga las instrucciones proporcionadas por la plataforma:
Una vez que todos los pasos se completen en Pastty, simplemente haga clic en el "Abierto" botón:
El usuario está conectado al clúster Hadoop con Amazon EMR:
Has creado y conectado con éxito al clúster Hadoop usando EMR.
Conclusión
Para crear un clúster de Amazon EMR, diríjase al tablero de EMR y haga clic en "Crear clúster" botón. Configure la configuración para el clúster EMR escribiendo el nombre y seleccionando la aplicación Hadoop para el clúster. Después de eso, edite las reglas entrantes de los grupos de seguridad creados por el clúster EMR y luego use masilla para conectarse al clúster.