¿Cuál es el motor de procesamiento de datos detrás de Amazon Elastic MapReduce?
¿Cuál es el motor de procesamiento de datos detrás de Amazon Elastic MapReduce?

Video: ¿Cuál es el motor de procesamiento de datos detrás de Amazon Elastic MapReduce?

Video: ¿Cuál es el motor de procesamiento de datos detrás de Amazon Elastic MapReduce?
Video: Amazon EMR – Elastic MapReduce 2024, Mayo
Anonim

Amazon EMR utiliza Apache Hadoop como su distribución motor de procesamiento de datos . Hadoop es un marco de software Java de código abierto que admite datos -Aplicaciones distribuidas intensivas que se ejecutan en grandes clústeres de hardware básico.

Además, ¿qué es Amazon Elastic MapReduce?

Amazon Elastic MapReduce ( EMR ) es un Servicios web de Amazon ( AWS ) herramienta para el procesamiento y análisis de big data. Amazon EMR procesa macrodatos en un clúster de servidores virtuales Hadoop en Amazon Elastic Compute Cloud ( EC2 ) y Amazonas Servicio de almacenamiento simple ( S3 ).

Además, ¿Amazon EMR está completamente administrado? Es un totalmente gestionado servicio de lago de datos que puede desacoplar el almacenamiento de datos de los recursos informáticos y, en cambio, hace que los clústeres informáticos sean escalables, estén disponibles para ser utilizados bajo demanda e incluye la capacidad de que varios clústeres accedan a los mismos conjuntos de datos a la vez.

También se puede preguntar, ¿cómo funciona AWS EMR?

Generalmente, cuando procesa datos en Amazon EMR , la entrada son datos almacenados como archivos en el sistema de archivos subyacente elegido, como Amazonas S3 o HDFS. Estos datos pasan de un paso al siguiente en la secuencia de procesamiento. El último paso escribe los datos de salida en una ubicación específica, como un Amazonas Cubo S3.

¿Cuál es la diferencia entre ec2 y EMR?

diferente a EMR , EC2 no clasifica los nodos esclavos en nodos centrales y de tareas. Esto aumenta el riesgo de perder datos HDFS en caso de que se elimine o pierda un nodo. EC2 utiliza las bibliotecas de Apache (s3a) para acceder a los datos en s3. Por otra parte, EMR utiliza código de propiedad de AWS para tener un acceso más rápido a s3.

Recomendado: