¿Qué es AWS MapReduce?
¿Qué es AWS MapReduce?

Video: ¿Qué es AWS MapReduce?

Video: ¿Qué es AWS MapReduce?
Video: ¿Qué es Amazon EMR? 2024, Mayo
Anonim

Amazon Elastic Mapa reducido (EMR) es un servicio web de Amazon ( AWS ) herramienta para el procesamiento y análisis de big data. Amazon EMR procesa macrodatos en un clúster Hadoop de servidores virtuales en Amazon Elastic Compute Cloud (EC2) y Amazon Simple Storage Service (S3).

De esta manera, ¿cómo funciona AWS EMR?

El servicio inicia un número especificado por el cliente de instancias de Amazon EC2, compuesto por un maestro y varios otros nodos. Amazonas EMR ejecuta el software Hadoop en estas instancias. El nodo maestro divide los datos de entrada en bloques y distribuye el procesamiento de los bloques a los otros nodos.

Además de arriba, ¿cuál es la diferencia entre ec2 y EMR? diferente a EMR , EC2 no clasifica los nodos esclavos en nodos centrales y de tareas. Esto aumenta el riesgo de perder datos HDFS en caso de que se elimine o pierda un nodo. EC2 utiliza las bibliotecas de Apache (s3a) para acceder a los datos en s3. Por otra parte, EMR utiliza código de propiedad de AWS para tener un acceso más rápido a s3.

Además, ¿AWS EMR está completamente administrado?

Amazonas Elastic MapReduce ( EMR ) es un totalmente gestionado Plataforma Hadoop y Spark de Amazonas Servicio web ( AWS ). Con EMR , AWS los clientes pueden poner en marcha rápidamente clústeres de Hadoop de varios nodos para procesar cargas de trabajo de big data.

¿AWS usa Hadoop?

Amazonas Servicios web usos el Apache de código abierto Hadoop tecnología informática distribuida para facilitar el acceso a grandes cantidades de potencia informática para ejecutar tareas con uso intensivo de datos. Hadoop , la versión de código abierto de MapReduce de Google, ya está siendo utilizada por empresas como Yahoo y Facebook.

Recomendado: