Верхний предел GC указывает, что ваша (крошечная) куча заполнена.
Это то, что часто происходит в операциях MapReduce, когда вы обрабатываете большое количество данных. Попробуйте следующее:
& lt; свойство>
& lt; name> mapred.child.java.opts & lt; / name>
& lt; значение> -Xmx1024m -XX: -UseGCOverheadLimit & lt; / value>
& lt; / property>
Кроме того, попробуйте следующие вещи:
Используйте комбинаторы, редукторы не должны получать списки длиннее, чем малые кратные числа карт
В то же время вы можете генерировать кучу дампа из OOME и анализировать с помощью YourKit, и т. д. анализировать его
Я бы предложил использовать COUNTIF
:
=COUNTIF(Sheet2!$A:$F,A2)>0
Снимок листа 1 и условное форматирование:
Снимок листа 2: