Самый быстрый и эффективный способ итерации большого набора данных в Java Spark

Ваша ошибка указывает, что ваш bundle.js загружен относительно текущего URL-адреса. Добавьте / в начало src, чтобы сделать его абсолютным.

<script src="/bundle.js"></script>
3
задан Jagger 21 January 2019 в 15:18
поделиться

1 ответ

Это действительно не так, как работает Spark.

Код, помещенный в foreachPartition, выполняется в ином контексте, чем оригинал

List<HashMap> finalJsonMap = new ArrayList<HashMap>();

Все, что вы можете сделать в такой настройке, - это изменить локальную копию.

Это многократно обсуждалось при переполнении стека и подробно описано в официальной документации в разделе «Понимание замыканий» .

Учитывая требуемый результат (то есть локальную коллекцию), на самом деле вы ничего не можете сделать, кроме как преобразовать свой код в mapPartitions и collect. Это, однако, вряд ли эффективно или идиоматично в Spark.

Я настоятельно рекомендую переосмыслить ваш текущий дизайн.

0
ответ дан zx485 21 January 2019 в 15:18
поделиться
Другие вопросы по тегам:

Похожие вопросы: