Псевдонимы являются большими, если Вы полагаете, что моя организация имеет имена таблиц как: SchemaName. DataPointName_SubPoint_Sub-SubPoint_Sub-Sub-SubPoint... Моя команда использует довольно стандартный набор сокращений, таким образом, догадки минимизированы. Мы будем иметь, заявляют ProgramInformationDataPoint, сокращенные pidp и представлениям только к замене
, хорошая вещь состоит в том, что, как только Вы начинаете этим способом и людьми, соглашаются с ним, это делает те файлы HAYUGE просто немного меньшими и легче справиться. По крайней мере, для меня, меньше символов для передачи той же информации, кажется, идет немного легче на моем мозге.
Не думайте о кубе как о трехмерной структуре (несмотря на название). «Измерение» в ситуации хранилища данных - это просто переменное значение, которое вы можете использовать для доступа к данным в вашем хранилище. Вы можете рассматривать их как ключевые части, но те, к которым можно получить доступ по отдельности или в сочетании, довольно легко (в отличие от первичных ключей в классической таблице).
Например, у вас могут быть следующие измерения на складе для хранение данных о клиентах и продажах.
Этот макет (5D "куб") будет позволяют легко выполнять запросы для клиентов, которые пересекают границы штата и которые могут иметь разные модели покупок в течение года (и даже в разное время месяца).
Все эти ключевые части будут просто указывать на одну цифру продаж за день месяца в конкретный месяц в определенном году в определенном месте для конкретного клиента.
Пример доступа к этим данным. Допустим, вы хотели увидеть, как ежемесячно меняются модели покупок всех клиентов, усредненные за все годы. Вы должны сделать это, чтобы увидеть, какие клиенты приносят вам наибольший доход в определенное время года, чтобы вы могли, например, нацелить свою рекламу на них за месяц или около того до этого.
Вы должны использовать идентификатор клиента и месяц. для извлечения информации, эффективно «свертывая» измерения состояния, года и дня месяца (другими словами, суммируйте показатели продаж для этих трех измерений, чтобы получить двумерный результат, клиенты по сравнению с месяцем).
Пример доступа к этим данным. Допустим, вы хотели увидеть, как ежемесячно меняются модели покупок всех клиентов, усредненные за все годы. Вы должны сделать это, чтобы увидеть, какие клиенты приносят вам наибольший доход в определенное время года, чтобы вы могли, например, настроить таргетинг на них своей рекламы за месяц или около того до этого.
Вы должны использовать идентификатор клиента и месяц. для извлечения информации, эффективно «свертывая» измерения состояния, года и дня месяца (другими словами, суммируйте показатели продаж для этих трех измерений, чтобы получить двумерный результат, клиенты по сравнению с месяцем).
Пример доступа к этим данным. Допустим, вы хотели увидеть, как ежемесячно меняются модели покупок всех клиентов, усредненные за все годы. Вы должны сделать это, чтобы увидеть, какие клиенты приносят вам наибольший доход в определенное время года, чтобы вы могли, например, нацелить свою рекламу на них за месяц или около того до этого.
Вы должны использовать идентификатор клиента и месяц. для извлечения информации, эффективно «сворачивая» измерения состояния, года и дня месяца (другими словами, суммируйте показатели продаж для этих трех измерений, чтобы получить двумерный результат, клиенты по сравнению с месяцем).
В мире DW слово «измерение» перегружено - меняет значение в зависимости от контекста. Вот пример.
В этом примере есть четыре измерения (дата, клиент, магазин, продукт) и один факт (продажи). Итак, типичная звезда Кимбалла будет выглядеть так:
Измерение (таблица) - это справочная таблица для свойств объектов, которые редко меняются. Товар, покупатель и магазин могут изменять некоторые свои свойства (атрибуты), но это происходит редко. Таблица фактов фиксирует взаимодействия между этими объектами. На пересечении измерений дата, магазин, продукт и покупатель находится мера SalesAmount
.