Hadoop Hbase: Распространяющиеся семейства столбца через таблицы или нет

В идеальном мире вы должны иметь возможность поместить некоторую переменную вместо окончательного пути к папке, и после создания рабочего потока для существующего файла установите переменную во время выполнения потока.

И, например, с действием Create file SharePoint это действительно работает.

Бот не с действием Excel Get a row, которое является известной проблемой.

РЕДАКТИРОВАТЬ: Наконец, нашли аккуратный обходной путь.

enter image description here

11
задан Thilo 25 March 2009 в 11:16
поделиться

2 ответа

У вас есть идея семейств столбцов: по сути, это просто подсказка HBase хранить и реплицировать эти элементы вместе для более быстрого доступа.

Если вы поместите два семейства столбцов в той же таблице и всегда иметь разные ключи для доступа к ним, тогда это действительно то же самое, что иметь их в двух разных таблицах. Вы получаете выгоду только от наличия двух семейств столбцов в одной таблице, к которым обращаются с помощью одних и тех же ключей.

Например: если у меня есть столбцы для общего количества просмотров страниц для данного веб-сайта, количество уникальных просмотров для одного и того же сайт, браузер, который пользователь использует для просмотра сайта, и их интернет-соединение, Я могу решить, что хочу, чтобы первые два были семейством столбцов, а последние два - другим семейством столбцов. Здесь все четыре доступны с помощью одного и того же ключа, а именно веб-сайта, о котором идет речь, поэтому я выигрываю, когда они находятся в одной таблице.

Если бы они были в разных таблицах, я бы в конечном итоге должен был выполнить операцию, похожую на соединение двух таблиц. Хотя я на самом деле не знаю чисел, поэтому не могу сказать, насколько медленна операция соединения (поскольку я не помню, чтобы у HBase было соединение, поскольку оно нереляционное) и каков переломный момент, когда расщепление их в отдельные таблицы перевешивает наличие их в одной и той же таблице (или наоборот).

Конечно, все это зависит от данных, которые вы пытаетесь сохранить, поэтому, если вам никогда не понадобится объединять таблицы,

8
ответ дан 3 December 2019 в 07:39
поделиться

Семейства столбцов - это компромисс между доступом, ориентированным на строки или на столбцы. Чтобы расширить пример веб-страницы Криса, при доступе к строке будут извлечены все данные (столбцы) для одного веб-сайта. Примером операции, ориентированной на столбцы, может быть суммирование количества просмотров страниц на всех сайтах.

Последняя операция не требует сведений о браузере и подключении, которые намного больше, чем числовые значения для количества просмотров, и будут значительно влияют на производительность запроса. Следовательно, HBase предоставляет семейства столбцов в качестве оптимизации, которая поддерживает операции с столбцами.

Что касается того, должны ли столбцы находиться в одной таблице ... Я бы просто следовал обычным рекомендациям по моделированию данных и поместил все столбцы в одну таблицу. если они являются атрибутами одного и того же объекта. Семейства столбцов относятся к производительности, а не к схеме.

Последняя операция не требует сведений о браузере и подключении, которые намного превышают числовые значения для количества просмотров и могут существенно повлиять на производительность запроса. Поэтому HBase предоставляет семейства столбцов в качестве оптимизации, которая поддерживает операции с столбцами.

Что касается того, должны ли столбцы находиться в одной таблице ... Я бы просто следовал обычным рекомендациям по моделированию данных и поместил все столбцы в одну таблицу. если они являются атрибутами одного и того же объекта. Семейства столбцов относятся к производительности, а не к схеме.

Последняя операция не требует сведений о браузере и подключении, которые намного превышают числовые значения для количества просмотров и могут существенно повлиять на производительность запроса. Поэтому HBase предоставляет семейства столбцов в качестве оптимизации, которая поддерживает операции с столбцами.

Что касается того, должны ли столбцы находиться в одной таблице ... Я бы просто следовал обычным рекомендациям по моделированию данных и поместил все столбцы в одну таблицу. если они являются атрибутами одного и того же объекта. Семейства столбцов относятся к производительности, а не к схеме.

Что касается того, должны ли столбцы находиться в одной таблице ... Я бы просто следовал обычным правилам моделирования данных и поместил все столбцы в одну таблицу, если они являются атрибутами одной и той же сущности. Семейства столбцов относятся к производительности, а не к схеме.

Что касается того, должны ли столбцы находиться в одной таблице ... Я бы просто следовал обычным правилам моделирования данных и поместил все столбцы в одну таблицу, если они являются атрибутами одной и той же сущности. Семейства столбцов относятся к производительности, а не к схеме.

8
ответ дан 3 December 2019 в 07:39
поделиться
Другие вопросы по тегам:

Похожие вопросы: