Мне нужно написать задание MapReduce, которое получает все строки в заданном диапазоне дат (скажем, за последний месяц). Это было бы проще простого, если бы мой ключ строки начинался с даты. Но мои частые запросы к Hbase касаются начальных значений ключа.
Мой ключ строки точно A|B|C|20120121|D . Где комбинация A/B/C вместе с датой (в формате YearMonthDay) создает уникальный ID строки.
Мои таблицы Hbase могут содержать до нескольких миллионов строк. Должен ли мой Mapper читать всю таблицу и фильтровать каждую строку, если она попадает в заданный диапазон дат или Scan / Filter может помочь справиться с этой ситуацией?
Может ли кто-нибудь предложить (или фрагмент кода) способ эффективно справиться с этой ситуацией?
Спасибо -Panks