Как улучшить Сканер HBase?

Question

Как улучшить Сканер HBase?

Ho я настраиваю HBase так, чтобы сканер только получил много записей за один раз? Или как я улучшаю сканер, когда база данных содержит много записей /

6

hbase

задан skaffman 15 May 2011 в 13:42

2 ответа

Другие вопросы по тегам:

hbase

Похожие вопросы:

score 11 · Answer 1

Я считаю, что сканер фактически запрашивает только один элемент за раз, если вы не настроили кеширование. Чтобы быть уверенным, вы можете проверить это с помощью getCaching ()

. Каждый раз, когда вы вызываете ResultScanner # next (), он будет извлекать следующий элемент. Вы также можете использовать ResultScanner # next (int) для получения нескольких результатов за раз.

При настройке сканера вы можете использовать Scan # setCaching для предварительного получения результатов http://hadoop.apache.org/hbase/docs/r0.20.4/api/org/apache /hadoop/hbase/client/Scan.html#setCaching(int)

Скорее всего, ваш сканер работает медленно, потому что вы читаете только одну запись за раз (что включает в себя все обратные и обратные действия протокола RPC и еще много чего ). Поэтому, если вы собираетесь много читать, позвольте системе заранее кэшировать для вас несколько результатов.

score 5 · Answer 2

Возможно, вы также захотите изучить API Filter, который позволяет выборочно возвращать клиенту подмножество строк или ячеек: http://hadoop.apache.org/hbase/docs/current/api/org/apache/hadoop/hbase/filter/package-summary.html.