Нет модуля с именем pymongo. Тем не менее, я только что установил [дубликат]

Question

Нет модуля с именем pymongo. Тем не менее, я только что установил [дубликат]

Если у вас действительно огромное количество записей, вы можете получить приблизительный счет, используя что-то вроде HyperLogLog , и это может быть быстрее, чем count(). Однако вы не сможете получить никакого результата, не отпуская работу.

При использовании Spark существуют два типа операций RDD: преобразования и действия . Грубо говоря, преобразования меняют RDD и возвращают новый RDD. Действия вычисляют или генерируют некоторый результат. Преобразования лениво оцениваются, поэтому они не запускают работу, пока действие не будет вызвано действием в конце последовательности преобразований.

Поскольку Spark является распределенной структурой программирования, для выполнения заданий много накладных расходов. Если вам нужно что-то, что больше похоже на «реальное время», что бы это ни значило, используйте базовую Scala (или Python), если ваши данные достаточно малы или перейдут на потоковый подход и сделайте что-то вроде обновления счетчика по мере прохождения новых записей.

2

python mongodb pymongo

задан 3 July 2015 в 07:55

1 ответ

Другие вопросы по тегам:

python mongodb pymongo

Нет модуля с именем pymongo. Тем не менее, я только что установил [дубликат]

1 ответ

Похожие вопросы: