Создание кэша в памяти, который сохраняется между выполнениями

Question

Создание кэша в памяти, который сохраняется между выполнениями

Я разрабатываю утилиту командной строки Python, которая потенциально включает в себя довольно большие запросы к набору файлов. Это достаточно конечный список запросов (подумайте об индексированных столбцах БД). Чтобы повысить производительность в процессе, я могу создать отсортированные/структурированные списки, карты и деревьяодин раз и обращаться к ним повторно, вместо того, чтобы каждый раз обращаться к файловой системе. время.

Однако эти кэши теряются, когда процесс завершается, и их необходимо перестраивать каждый раз при запуске скрипта, что значительно увеличивает время выполнения моей программы. Я хотел бы определить лучший способ обмена этими данными между несколькими выполнениями моей команды, которые могут выполняться одновременно, одно за другим или со значительными задержками между выполнениями.

Требования:

Должен быть быстрым — любой вид обработки для каждого выполнения должен быть сведен к минимуму, включая дисковый ввод-вывод и создание объектов.
Должен быть независимым от ОС (или, по крайней мере, иметь возможность использовать аналогичное базовое поведение в Unix/Windows, что более вероятно).
Должны быть разрешены достаточно сложные запросы/фильтрация – я не думаю, что карта ключ/значение будет достаточно хорошей
Разве ненужно обновлять – (кратко) устаревшие данные все в порядке, это просто кеш, фактические данные записываются на диск отдельно.
Невозможно использовать тяжеловесный демон-процесс, такой как MySQL или MemCached — я хочу минимизировать затраты на установку, а просить каждого пользователя установить эти службы — это слишком.

Предпочтения:

Я бы хотел, если возможно, вообще избежать какого-либо длительного процесса демона.
Хотя я хотел бы иметь возможность быстро обновлять кеш, восстановление всего кеша при обновлении не является концом света, быстрое чтение гораздо важнее, чем быстрая запись.

В моем идеальном фантастическом мире я мог бы напрямую хранить объекты Python между выполнениями, что-то вроде потоков Java (например, запросов Tomcat), разделяющих одноэлементные объекты хранилища данных, но я понимаю, что это может быть невозможно. Однако чем ближе я к этому подберусь, тем лучше.

Возможные варианты:

Я знаю, что pickle— это эффективный способ хранения объектов Python, поэтому он может иметь преимущество в скорости по сравнению с любым видом ручного хранения данных. Могу ли я подключить рассол к любому из вышеперечисленных вариантов? Будет ли это лучше, чем плоские файлы или SQLite?

Я знаю, что есть много вопросов, связанных с этим, но я немного покопался и не смог найти ничего, что напрямую отвечало бы моему вопросу относительно многократного выполнения командной строки.

Я полностью признаю, что, возможно, слишком много думаю об этом. Я просто пытаюсь прочувствовать свои варианты, и стоят ли они того или нет.

Большое спасибо за помощь!

7

caching command-line os-agnostic python

задан Community 23 May 2017 в 10:27

0 ответов

Другие вопросы по тегам:

caching command-line os-agnostic python

Создание кэша в памяти, который сохраняется между выполнениями

0 ответов

Похожие вопросы: