¿Cómo se logra la localización de datos en Hadoop?
¿Cómo se logra la localización de datos en Hadoop?

Video: ¿Cómo se logra la localización de datos en Hadoop?

Video: ¿Cómo se logra la localización de datos en Hadoop?
Video: Práctica de Hadoop MapReduce 2024, Mayo
Anonim

Localización de datos en Hadoop . Tome el ejemplo de muestra de Wordcount, donde la mayoría de las palabras se han repetido durante 5 Lacs o más veces. En ese caso, después de la fase Mapper, cada salida del mapper tendrá palabras en el rango de 5 Lacs. Este proceso completo de almacenar la salida de Mapper en LFS se denomina como Localización de datos.

Teniendo esto en cuenta, ¿qué es la localización de datos en Hadoop?

El concepto de Datos localidad en Datos de Hadoop localidad en Mapa reducido se refiere a la capacidad de mover el cálculo cerca de donde el real datos reside en el nodo, en lugar de moverse grandes datos a la computación. Esto minimiza la congestión de la red y aumenta el rendimiento general del sistema.

Además, ¿cómo se almacenan los macrodatos? La mayoría de la gente asocia automáticamente HDFS, o sistema de archivos distribuido Hadoop, con Hadoop datos almacenes. HDFS almacena información en clústeres que se componen de bloques más pequeños. Estos bloques son almacenado en físico en el sitio almacenamiento unidades, como unidades de disco internas.

Así que, ¿cómo se almacenan los datos en Hadoop?

En un Hadoop racimo, el datos dentro de HDFS y el sistema MapReduce se encuentran en todas las máquinas del clúster. Datos es almacenado en datos bloques en los DataNodes. HDFS replica esos datos bloques, generalmente de 128 MB de tamaño, y los distribuye para que se repliquen en varios nodos del clúster.

¿Cómo se almacenan los archivos en HDFS?

HDFS expone un expediente espacio de nombres del sistema y permite que los datos del usuario sean almacenado en archivos . Internamente, un expediente se divide en uno o más bloques y estos bloques son almacenado en un conjunto de DataNodes. El NameNode se ejecuta expediente operaciones del espacio de nombres del sistema como abrir, cerrar y cambiar el nombre archivos y directorios.

Recomendado: