¿Qué es Emrfs?
¿Qué es Emrfs?

Video: ¿Qué es Emrfs?

Video: ¿Qué es Emrfs?
Video: Amazon EMR – Elastic MapReduce 2024, Mayo
Anonim

El sistema de archivos EMR ( EMRFS ) es una implementación de HDFS que todos los clústeres de Amazon EMR utilizan para leer y escribir archivos normales de Amazon EMR directamente en Amazon S3. El cifrado de datos le permite cifrar objetos que EMRFS escribe en Amazon S3 y habilita EMRFS para trabajar con objetos cifrados en Amazon S3.

Con respecto a esto, ¿cuál es la visión coherente de Emrf?

los Vista coherente EMRFS crea y usa metadatos en una tabla de Amazon DynamoDB para mantener un vista coherente de sus objetos S3. Esta tabla rastrea ciertas operaciones pero no contiene ninguno de sus datos.

¿Cuál es la diferencia entre s3 y s3a? Este es el diferencia entre el tres: s3 es una superposición basada en bloques en la parte superior de Amazon S3 , mientras que s3n / s3a no son. Estos están basados en objetos. s3n admite objetos de hasta 5 GB cuando lo que importa es el tamaño, mientras que s3a admite objetos de hasta 5 TB y tiene un mayor rendimiento.

En consecuencia, ¿EMR utiliza HDFS?

EMR Sistema de archivos (EMRFS) puedo usar cualquiera HDFS o Amazon S3 como sistema de archivos en su clúster. Muy a menudo, Amazon S3 es utilizado para almacenar datos de entrada y salida y los resultados intermedios se almacenan en HDFS.

¿Qué es s3a?

S3A (Esquema URI: s3a ) Sucesor del S3 Nativo, s3n fs, el S3a : el sistema utiliza las bibliotecas de Amazon para interactuar con S3 . Esto permite S3a para admitir archivos más grandes (no más límite de 5 GB), operaciones de mayor rendimiento y más.

Recomendado: