Не удалось запустить пример SparkPi на Kubernetes Spark 2.4.0

Вы также можете отобразить все данные, попросив pandas вернуть HTML-разметку, а затем IPython отобразит таблицу HTML.

import pandas as pd
from IPython.display import HTML
data = pd.read_csv('yourdata.csv')
HTML(data.to_html())

Используя IPython 3.0.0 и Python 3.4, я обнаружил, что display(data), как описано в @Jakob, будет отображаться в виде таблицы с полосами прокрутки вверх / вниз и влево / вправо, но таблица по-прежнему шире, чем ячейка, а некоторые столбцы находятся вне экрана справа. Чтобы увидеть все данные, нужно свернуть ячейку, которая добавляет полосы прокрутки. Следовательно, у вас есть прокрутка в окне прокрутки, что не идеально, поскольку вам нужно переместить фокус между удвоенными полосами прокрутки, чтобы полностью перемещаться по данным.

Используя метод HTML, вы сделать огромную таблицу как есть без полос прокрутки. Затем эта ячейка может быть свернута вниз, чтобы показать только одну вертикальную и горизонтальную полосу, что более удобно.

Предостережение относительно использования HTML - это то, что таблица занимает больше времени для рендеринга. Я использовал только матрицу размером 150x50, и разница в скорости была заметной, но не неудобной. Если у вас огромный стол, не используйте этот метод, чтобы отображать всю вещь сразу. Тем не менее, если у вас есть огромная таблица, то все это сразу станет плохой идеей, но вы пытаетесь это сделать.

1
задан Frank Wilson 17 January 2019 в 10:03
поделиться

1 ответ

Я думаю, что проблема в основном связана с тем, что мой «последний» тег докера указывал на изображение, которое было для предыдущей версии spark (v2.3.2). Кажется, что способ, которым контейнер получает параметры от spark-submit и kubernetes, немного изменился. Мои оставшиеся проблемы запуска спарк-конвейеров, похоже, связаны с serviceAccounts (и, вероятно, относятся к другому вопросу).

0
ответ дан Frank Wilson 17 January 2019 в 10:03
поделиться
Другие вопросы по тегам:

Похожие вопросы: