Что такое хранилище данных?

Меня спросил клиент, что действительно означает термин "хранилище данных".

Я думал о ETL, деталях модели данных, различий к NoSQL, Облакам, 'нормальному' DBMS, MDM (управление мастер-данными) и т.д., но не смог описать термин в нескольких словах ему... (На самом деле я сделал некоторый разговор и оставил его неосвещенным.)

Как может "хранилище данных", описанное в 1-3 (или немного больше) предложения?

21
задан Brian Tompsett - 汤莱恩 12 November 2015 в 12:04
поделиться

7 ответов

Для не технических ребят лучше всего описать это как "Огромное количество данных, хранящихся в специализированной компьютерной системе. Данные обычно относятся к какой-то конкретной области, а вся система разработана так, чтобы быть быстрой и оптимизированной для выполнения некоторых специальных задач. Данные, хранящиеся в хранилищах данных, в основном используются для анализа или в процессах принятия решений."

Не уверен, что этого достаточно:) В Интернете есть много ссылок на эту тему, но если бы кто-то попросил меня дать краткое определение, я бы использовал что-то похожее на то, что я написал выше.

18
ответ дан 29 November 2019 в 20:28
поделиться

Хранилище данных - это попытка сделать разрозненные системы однородными, независимо от базовой технологии или механизма хранения.

Вы могли бы вникнуть в «почему» хранилищ данных, но это другой вопрос.

4
ответ дан 29 November 2019 в 20:28
поделиться

По крайней мере, теоретически идея хранилища данных заключается в предоставлении консолидированного представления данных из множества существующих систем, которые обычно нецелесообразно переписывать для непосредственной консолидации данных. Таким образом, хранилище данных собирает данные из этих существующих систем и обеспечивает (по крайней мере, иллюзию), что все данные находятся в одном месте, поэтому их можно запрашивать одним способом.

Основная цель (обычно) состоит в том, чтобы разрешить корреляцию между данными из существующих систем. Например, вы можете сравнить, сколько времени ваш продавец провел с клиентом X (который хранится в одной системе), с тем, сколько покупатель X купил (хранится во второй системе), и насколько клиент X доволен тем, что он получает (хранится, конечно, в третьей системе).

С практической точки зрения это часто означает, что идеи клиента находятся где-то между плохо определенными и совершенно безумными. О стоимости и сроках почти невозможно даже догадаться, а точную оценку явно невозможно. Доставить то, что он действительно хочет, почти наверняка невозможно, а выяснение чего-то, что будет полезно, потребует достаточно времени и работы, поэтому ваш первый шаг - сделать то, что вы делаете, достаточно техничным, чтобы у него не было сердца. атаковать, когда он понимает стоимость и / или график.

6
ответ дан 29 November 2019 в 20:28
поделиться

Из wiki :

Хранилище данных - это хранилище организация хранится в электронном виде данные, предназначенные для облегчения отчетности и анализ 1 .

Это определение хранилища данных фокусируется на хранении данных. Однако средства для извлечения и анализа данных, извлекать, преобразовывать и загружать данные, а также для управления словарем данных также считались важными компонентами система хранения данных. Много ссылки на использование хранилищ данных этот более широкий контекст. Таким образом, расширенное определение данных складирование включает бизнес инструменты разведки, инструменты для извлечения, преобразовать и загрузить данные в репозиторий, а также инструменты для управления и получить метаданные.

6
ответ дан 29 November 2019 в 20:28
поделиться

KISS ...

Хранилище данных - это хранилище данных, относящихся к данной организации и ее деятельности. Эти данные позволят анализировать и составлять отчеты о деятельности организации по различным соответствующим параметрам, таким как время, структура, потоки деятельности. Эти измерения можно комбинировать, а результаты агрегировать с помощью соответствующих иерархий.

3
ответ дан 29 November 2019 в 20:28
поделиться

Хранилище данных - это база данных, система загрузки данных и отчетности, предназначенная для агрегирования данных из нескольких источников и представления их в удобной для извлечения форме и составлении отчетов. С практической точки зрения преимущества успешного проекта хранилища данных заключаются в следующем:

  • Статистическая и финансовая отчетность - хранилища данных позволяют легко работать с данными в совокупности и получать из них полезный анализ, особенно если у вас 65537 или более строк данные.

  • Безопасность данных - данные хорошо обработаны и не содержат ловушек для молодых игроков. Специальные системы отчетов могут использоваться неопытными пользователями с низким риском получения недостоверных результатов в отчетах, не заметив их.

  • Прозрачность - бизнес может видеть и выявлять проблемы с данными в базовых системах. Хранилище данных может быть хорошим инструментом для повышения качества данных.

  • Расширение возможностей - инструменты отчетности конечных пользователей должны поддерживать большинство требований к управленческой информации с минимальным набором, требующим разработки индивидуального отчета техническим специалистом.

3
ответ дан 29 November 2019 в 20:28
поделиться

С практической точки зрения: меняются предприятия, меняется среда, то, что было важным вопросом вчера, может быть не сегодня и, скорее всего, не будет завтра.Это особенно верно при работе с вопросами на уровне генерального директора.

Если вы не можете предвидеть, какими будут вопросы, ваш единственный выход - предоставить средства для быстрого ответа на любой вопрос. Это то, что пытаются или призваны делать хранилища данных. Откуда берутся данные и из скольких разрозненных систем не имеет значения.

Многие хранилища данных не могут ответить на любой вопрос быстро, потому что их технология требует, чтобы вы выворачивали доступные необработанные данные «наизнанку» (создавая кубы), чтобы обеспечить «быстро». А определение этих кубиков ограничивает круг вопросов, на которые можно ответить.

1
ответ дан 29 November 2019 в 20:28
поделиться
Другие вопросы по тегам:

Похожие вопросы: