Проблема идемпотентности облачных функций

Поскольку файл-файл читает файл, он использует указатель, чтобы отслеживать, где он находится. Если вы прочитаете часть файла, а затем вернитесь к нему позже, он поднимется туда, где вы остановились. Если вы прочитаете весь файл и вернетесь к тому же файловому объекту, это будет похоже на чтение пустого файла, потому что указатель находится в конце файла, и читать его нечего. Вы можете использовать file.tell(), чтобы увидеть, где в файле указатель, и file.seek установить указатель. Например:

>>> file = open('myfile.txt')
>>> file.tell()
0
>>> file.readline()
'one\n'
>>> file.tell()
4L
>>> file.readline()
'2\n'
>>> file.tell()
6L
>>> file.seek(4)
>>> file.readline()
'2\n'

Кроме того, вы должны знать, что file.readlines() читает весь файл и сохраняет его как список. Это полезно знать, потому что вы можете заменить:

for line in file.readlines():
    #do stuff
file.seek(0)
for line in file.readlines():
    #do more stuff

на:

lines = file.readlines()
for each_line in lines:
    #do stuff
for each_line in lines:
    #do more stuff

Вы также можете перебирать файл по одной строке за раз, не сохраняя весь файл в памяти (это может быть очень полезно для очень больших файлов):

for line in file:
    #do stuff
1
задан Eduard 5 March 2019 в 15:29
поделиться

1 ответ

Облачные функции дают хотя бы раз гарантии для выполнения фоновых функций. Это означает, что функция может выполняться несколько раз за одно событие. Хотя это не распространено, это просто способ, которым масштабируемые системы справляются с потенциальными ошибками, когда несколько машин должны координировать и обмениваться данными асинхронно.

Если повторение вызова функции для события проблематично для вашей функции, вам необходимо кодировать свою функцию таким образом, чтобы она была идемпотентной. Вы можете посмотреть это видео , чтобы немного больше понять, и прочитать документацию .

Общую проблему, которую нельзя избежать, называют проблемой Two Generals в информатике. Вы можете прочитать об этом, чтобы лучше понять большую проблему. По сути, все компьютерные системы, в которых работают облачные функции, не могут на 100% надежно постоянно общаться друг с другом (из-за ошибок и потери данных), поэтому повторные попытки необходимы для обеспечения выполнения функции хотя бы раз, что лучше чем никогда.

0
ответ дан Doug Stevenson 5 March 2019 в 15:29
поделиться
Другие вопросы по тегам:

Похожие вопросы: