¿Qué es la chispa de transmisión?
¿Qué es la chispa de transmisión?

Video: ¿Qué es la chispa de transmisión?

Video: ¿Qué es la chispa de transmisión?
Video: 7 SINTOMAS DE FALLA DEL SENSOR DE CIGÜEÑAL CKP 2024, Noviembre
Anonim

Transmisión variables en Apache Chispa - chispear es un mecanismo para compartir variables entre ejecutores que deben ser de solo lectura. Sin transmisión variables estas variables se enviarían a cada ejecutor para cada transformación y acción, y esto puede causar una sobrecarga de la red.

También hay que saber cuándo debería transmitir Spark.

Transmisión Las variables se utilizan principalmente cuando las tareas en varias etapas requieren los mismos datos o cuando se requiere el almacenamiento en caché de los datos en la forma deserializada. Transmisión las variables se crean usando una variable v llamando a SparkContext.

También se puede preguntar, ¿cómo define el acumulador la chispa? Acumuladores son variables que solo se “agregan” a través de una operación asociativa y, por lo tanto, pueden ser soportadas de manera eficiente en paralelo. Se pueden usar para implementar contadores (como en MapReduce) o sumas. Chispa - chispear apoya de forma nativa acumuladores de tipos numéricos, y los programadores pueden agregar soporte para nuevos tipos.

Además, ¿qué es la variable compartida en Spark?

Variables compartidas son los variables que deben ser utilizados por muchas funciones y métodos en paralelo. Variables compartidas se puede utilizar en operaciones paralelas. Chispa - chispear segrega el trabajo en la operación más pequeña posible, un cierre, que se ejecuta en diferentes nodos y cada uno tiene una copia de todos los variables de El Chispa - chispear trabajo.

¿Podemos transmitir un DataFrame?

Chispa - chispear pueden “ transmisión Un pequeño Marco de datos enviando todos los datos en ese pequeño Marco de datos a todos los nodos del clúster. Después de lo pequeño Marco de datos es emitido , Chispa - chispear pueden realizar una combinación sin mezclar ninguno de los datos en el gran Marco de datos.

Recomendado: