Tabla de contenido:

¿Cómo programo un trabajo de colmena en oozie?
¿Cómo programo un trabajo de colmena en oozie?

Video: ¿Cómo programo un trabajo de colmena en oozie?

Video: ¿Cómo programo un trabajo de colmena en oozie?
Video: Oozie job scheduling | Big data jobs with Oozie and Shell script 2024, Mayo
Anonim

Para programar trabajo de Hive utilizando Oozie , necesitas escribir un Colmena -acción.

hql) en él.

  1. Cree un directorio en HDFS activando el siguiente comando.
  2. hadoop fs -mkdir -p / user / oozie / workflows /
  3. Ponga flujo de trabajo. xml, Colmena script (create_table. hql) y colmena -sitio. xml en el directorio creado en el paso 2. Puede utilizar el siguiente comando.

Entonces, ¿cómo ejecuto el script de Hive en oozie?

Ejecutar trabajos de Hive con Oozie

  1. Especifique el sitio de colmena. xml en el parámetro job-xml.
  2. Especifique el nombre de la secuencia de comandos (por ejemplo, secuencia de comandos. Q) que contiene la consulta de colmena en el parámetro de secuencia de comandos.
  3. Opcionalmente, agregue propiedades utilizadas por el trabajo del iniciador de Oozie. Agrega el prefijo oozie. lanzador a los nombres de propiedad.

Además, ¿cómo ejecuto el flujo de trabajo de Oozie? Ejecución del flujo de trabajo de Oozie desde la línea de comandos

  1. Inicie sesión en la consola web.
  2. Copie los ejemplos de oozie en su directorio de inicio en la consola web: cp / usr / hdp / current / oozie-client / doc / oozie-examples. alquitrán. gz.
  3. Extraiga archivos de tar tar -zxvf oozie-examples.tar.gz.
  4. Copie el directorio de ejemplos en HDFS hadoop fs -copyFromLocal examples.

En este sentido, ¿cómo programo un trabajo de Hadoop?

Cómo programar trabajos en hadoop - Quora. La forma más sencilla es envolver su código en un script de shell y calendario es como cron trabajo en el nodo de borde (el nodo donde normalmente envía su trabajos ). Pero normalmente empaquetar el código en un script y ejecutarlo como trabajo es difícil de depurar. probar y mantener.

¿Qué es el flujo de trabajo de Oozie?

Oozie es un flujo de trabajo sistema de programación para administrar trabajos de Apache Hadoop. Flujo de trabajo de Oozie Los trabajos son Gráficos Acíclicos Dirigidos (DAG) de acciones. Oozie Los trabajos de coordinador son recurrentes Flujo de trabajo de Oozie trabajos activados por el tiempo (frecuencia) y la disponibilidad de datos. Oozie es un sistema escalable, confiable y extensible.

Recomendado: