Почему искра занимает время, чтобы выделить исполнителей и память перед отправкой задания [дублировать]

вы также можете использовать это:

.dropdown {
height: 0px;
width: 0px;
opacity: .0;
color: white;
}
.dropdown:hover {
height: 20px;
width: 50px;
opacity: 1;
transition: opacity 200ms;
/* Safari */
-webkit-transition: opacity 200ms;
}
10
задан zeodtr 23 November 2015 в 02:30
поделиться

4 ответа

Это довольно типично. Моя система занимает около 20 секунд от запуска spark-submit до получения SparkContext.

Как говорится в документах в нескольких местах, решение состоит в том, чтобы превратить ваш драйвер в RPC-сервер. Таким образом, вы инициализируетесь один раз, а затем другие приложения могут использовать контекст драйвера как службу.

Я занимаюсь этим с помощью своего приложения. Я использую http4s и превращаю свой драйвер в веб-сервер.

0
ответ дан David Griffin 27 August 2018 в 06:55
поделиться

Для быстрого создания Spark-Context

Протестировано на EMR:

  1. cd /usr/lib/spark/jars/; zip /tmp/yarn-archive.zip *.jar
  2. cd path/to/folder/of/someOtherDependancy/jarFolder/; zip /tmp/yarn-archive.zip jar-file.jar
  3. zip -Tv /tmp/yarn-archive.zip для целостности теста и расширенной отладки
  4. , если yarn-archive.zip уже существует в hdfs, тогда hdfs dfs -rm -r -f -skipTrash /user/hadoop/yarn-archive.zip hdfs dfs -put /tmp/yarn-archive.zip /user/hadoop/ else hdfs dfs -put /tmp/yarn-archive.zip /user/hadoop/
  5. --conf spark.yarn.archive="hdfs:///user/hadoop/yarn-archive.zip" использует этот аргумент в spark-submit

Причина, по которой это может сработать, мастер не должен распространять все банки на ведомые устройства.

Я понял, что он может сэкономить ваше время на 3-5 секунд, это время также зависит от количества узлов в кластере , Больше узлов, больше вы экономите время.

0
ответ дан desaiankitb 27 August 2018 в 06:55
поделиться

Если вы используете mac os для запуска некоторых задач в автономном режиме,

Просто не забудьте включить remote ssh connection в ваш system preference -> sharing (я не знаю, почему мы должны делать что)

Перед тем, как включить его, мне понадобится около 1 минуты для запуска spark-submit xx.py

. После включения его мне потребуется всего 3 секунды, чтобы запустить его.

Надеюсь, это поможет другим людям решить проблемы на платформе Mac os

0
ответ дан poc.hsu 27 August 2018 в 06:55
поделиться

Вы можете проверить Apache Livy, который является REST API перед Spark.

У вас может быть один сеанс и несколько запросов к этой сессии Spark / Livy.

1
ответ дан Tagar 27 August 2018 в 06:55
поделиться
Другие вопросы по тегам:

Похожие вопросы: