2
ответа

Стандартное отклонение с использованием mrjob в Python показывает, что у файла ошибки & ldquo; нет атрибутов для запуска & rdquo;

из mrjob.job import MRJob импорт статистики импорт sys класс MRFindStdev (): def mapper (self, _, line): для числа в line.split (','): yield number, float (number) def ...
вопрос задан: 3 March 2019 21:40
0
ответов

Узел MapReduce с максимальной степенью

Я написал код, используя MRJob для вычисления максимальной степени графа. Но мой подход неверен, потому что у меня есть ограничение, что все узлы не могут быть загружены в память одной машины. Мои данные поступают ...
вопрос задан: 17 March 2019 22:07
0
ответов

Как python subprocess.Popen может видеть select.poll, а потом не видеть? (объект select 'module' не имеет атрибута 'poll')

Я использую (потрясающую) библиотеку mrjob от Yelp для запуска моих программ на python в Elastic Map Reduce от Amazon. Она зависит от subprocess в стандартной библиотеке python. С моего mac, на котором запущен python2.7.2, ...
вопрос задан: 27 September 2017 09:43
0
ответов

Numpy и Scipy с Amazon Elastic MapReduce

Используя mrjob для запуска кода Python на Amazon Elastic MapReduce, я успешно нашел способ обновить numpy и scipy изображения EMR. При запуске с консоли работают следующие команды: tar ...
вопрос задан: 27 September 2017 09:28
0
ответов

Несколько входов с MRJob

Я пытаюсь научиться использовать Yelp Python API для MapReduce, MRJob. Их простой пример счетчика слов имеет смысл, но мне любопытно, как можно обрабатывать приложение, включающее несколько входов. Для ...
вопрос задан: 24 July 2017 17:12
0
ответов

Как получить имя входного файла в MRjob

Я пишу функцию карты, используя mrjob. Мой ввод будет поступать из файлов в каталоге на HDFS. Имена файлов содержат небольшую, но важную информацию, которой нет в самих файлах. Есть...
вопрос задан: 11 July 2012 14:26