¿Qué es la transmisión de chispas?
¿Qué es la transmisión de chispas?

Video: ¿Qué es la transmisión de chispas?

Video: ¿Qué es la transmisión de chispas?
Video: COMO ELIMINAR LA CHISPA QUE EMITE LOS CARBONES 2024, Noviembre
Anonim

Transmisión variables en Apache Chispa - chispear es un mecanismo para compartir variables entre ejecutores que deben ser de solo lectura. Sin transmisión variables estas variables se enviarían a cada ejecutor para cada transformación y acción, y esto puede causar una sobrecarga de la red.

Del mismo modo, la gente pregunta, ¿cuándo debería transmitir chispa?

Transmisión Las variables se utilizan principalmente cuando las tareas en varias etapas requieren los mismos datos o cuando se requiere el almacenamiento en caché de los datos en la forma deserializada. Transmisión las variables se crean usando una variable v llamando a SparkContext.

Además, ¿qué son los acumuladores y las variables de difusión en Spark? Chispa - chispear admite dos tipos de compartidos variables : variables de transmisión , que se puede utilizar para almacenar en caché un valor en la memoria en todos los nodos, y acumuladores , que son variables que sólo se "agregan", como contadores y sumas.

Teniendo esto en cuenta, ¿qué es el acumulador de chispas?

Acumuladores son variables que solo se “agregan” a través de una operación asociativa y, por lo tanto, pueden ser soportadas de manera eficiente en paralelo. Se pueden usar para implementar contadores (como en MapReduce) o sumas. Chispa - chispear apoya de forma nativa acumuladores de tipos numéricos, y los programadores pueden agregar soporte para nuevos tipos.

¿Cómo actualizo mi variable de transmisión en Spark?

  1. Mueva la búsqueda de datos de referencia a forEachPartition o forEachRdd para que resida completamente en los trabajadores.
  2. Reinicie el contexto de Spark cada vez que cambie el refdata, con una nueva variable de transmisión.

Recomendado: