Как эффективно сканировать строки HBase

Мне нужно написать задание MapReduce, которое получает все строки в заданном диапазоне дат (скажем, за последний месяц). Это было бы проще простого, если бы мой ключ строки начинался с даты. Но мои частые запросы к Hbase касаются начальных значений ключа.

Мой ключ строки точно A|B|C|20120121|D . Где комбинация A/B/C вместе с датой (в формате YearMonthDay) создает уникальный ID строки.

Мои таблицы Hbase могут содержать до нескольких миллионов строк. Должен ли мой Mapper читать всю таблицу и фильтровать каждую строку, если она попадает в заданный диапазон дат или Scan / Filter может помочь справиться с этой ситуацией?

Может ли кто-нибудь предложить (или фрагмент кода) способ эффективно справиться с этой ситуацией?

Спасибо -Panks

10
задан Panks 22 January 2012 в 18:38
поделиться