Заполнитель «z» ничего не имеет в нем, и ему ничего не назначено. Поэтому, когда вы запускаете сеанс, ничего не нужно делать, потому что «z» ничем не зависит от модели. Я думаю, что вы хотите,
output =sess.run(y,feed_dict={x: y_pred})
Поскольку «y» - это выходной тензор.
Сказав это, я думаю, вы, возможно, захотите прочитать немного больше на графике потока используемый тензорным потоком, чтобы понять, как происходят вычисления. В настоящее время это не похоже на то, что вы полностью поняли переменные-заполнители.
Это будет зависеть от размера вашего ряда данных. Там нет правильного ответа, чтобы выбрать между вариантами, которые вы предоставили. Я буду больше думать о том, какое максимальное количество записей я могу получить, чтобы не замедлить запрос клиента.
В 2019 году любое подобное решение связано не столько с производительностью, сколько с пользовательским интерфейсом.
Большинству пользователей не нравятся задержки, поэтому вы хотите быть максимально отзывчивыми. Если это много маленьких запросов, чтобы дать пользователю возможность что-то сделать (вместо ожидания 1-2 секунд для возврата большого запроса), вы должны предпочесть это решение. Это зависит от того, на что похож ваш опыт на экране.
Сказав, что 100 записей - это не очень большая полезная нагрузка (как правило), поэтому, если она достаточно мала и, возможно, кэширована, вы можете просто получить все 100 сразу.