Параллелизм в Python

Question

Параллелизм в Python

Каковы опции для достижения параллелизма в Python? Я хочу выполнить набор зависящих от ЦП вычислений по некоторым очень большим растрам и хотел бы параллелизировать их. Происходя из среды C, я знаком с тремя подходами к параллелизму:

Процессы передачи сообщений, возможно распределенные через кластер, например, MPI.
Явный параллелизм общей памяти, или использующий pthreads или ветвление (), канал (), и. al
Неявный параллелизм общей памяти, с помощью OpenMP.

Выбор подхода к использованию является упражнением в компромиссах.

В Python, какие подходы доступны и каковы их характеристики? Существует ли clusterable клон MPI? Каковы предпочтительные способы достигнуть параллелизма общей памяти? Я услышал ссылку на проблемы с GIL, а также ссылки на tasklets.

Короче говоря, что я должен знать о различных стратегиях распараллеливания в Python прежде, чем выбрать между ними?

22

python multithreading parallel-processing message-passing

задан fmark 7 June 2010 в 08:22

4 ответа

В зависимости от того, сколько данных вам нужно обработать и сколько процессоров / машин вы собираетесь использовать, в некоторых случаях лучше написать их часть на C (или Java / C #, если вы хотите использовать jython / IronPython. )

Ускорение, которое вы можете получить от этого, может сделать больше для вашей производительности, чем параллельная работа на 8 процессорах.

0

ответ дан 29 November 2019 в 05:41

Новый (2.6) модуль multiprocessing - это то, что нужно. Он использует подпроцессы, что позволяет обойти проблему GIL. Он также абстрагирует некоторые вопросы локальности/удаленности, поэтому выбор между локальным или разнесенным по кластеру кодом может быть сделан позже. Документация, на которую я ссылался выше, довольно сложна для изучения, но должна обеспечить хорошую основу для начала работы.

5

ответ дан 29 November 2019 в 05:41

Для этого существует множество пакетов, наиболее подходящим из которых, как уже говорилось, является многопроцессорность, особенно с классом "Pool".

Аналогичный результат может быть получен параллельным питоном , который дополнительно предназначен для работы с кластерами.

В любом случае, я бы сказал, используйте многопроцессорность.

0

ответ дан 29 November 2019 в 05:41

Другие вопросы по тегам:

python multithreading parallel-processing message-passing

Параллелизм в Python

4 ответа

Похожие вопросы: