0
ответов

каков правильный тип данных для уникального ключа в базе данных postgresql?

какой тип данных я должен выбрать для уникального идентификатора ключа (пользователя, например )в таблице базы данных postgresql? это тот самый bigint? спасибо
вопрос задан: 2 August 2012 13:09
0
ответов

Как работать с BIG DATA Data Margin/Fact Table? ( 240 миллионов строк )

У нас есть клиент BI, который ежемесячно генерирует около 40 миллионов строк в своих таблицах базы данных о продажах, созданных на основе их транзакций продаж. Они хотят создать витрину данных о продажах с помощью своих ...
вопрос задан: 7 June 2012 19:13
0
ответов

База данных - таблица фактов и таблица измерений

Читая книгу по бизнес-объектам, я наткнулся на таблицу терминов-фактов и таблицу измерений. Это стандартная вещь для всех баз данных, что все они имеют таблицу фактов и таблицу измерений или ...
вопрос задан: 30 March 2012 08:22
0
ответов

Агрегация данных — ежедневный сценарий SQL и хранилище данных

Прошу прощения, если этот вопрос уже задавался (я очень мало знаю о хранилище данных/BI и еще не освоил ключевые слова ). У меня есть таблица, которая увеличивается более чем на 100 000 строк в день, каждая строка имеет ...
вопрос задан: 23 March 2012 12:54
0
ответов

Одна или несколько таблиц фактов?

Я пытаюсь построить киоск данных. У меня много измерений, и пара измерений - фактов. Каждая мера связана со всеми измерениями с точки зрения бизнеса. Есть стандартный подход, который там...
вопрос задан: 19 March 2012 13:11
0
ответов

Шаблоны проектирования баз данных/соображения при использовании служб Master Data Services

Я пытаюсь найти хороший источник информации о соображениях/шаблонах проектирования баз данных и/или таблиц, которые следует учитывать при проектировании хранилища данных и использовании MDS /DQS-компоненты...вещи...
вопрос задан: 19 March 2012 08:31
0
ответов

Как классифицировать/категоризировать строки в соответствии с правилами регулярных выражений в Python

Я пишу ETL-скрипт на Python, который получает данные в файлах CSV, проверяет и дезинфицирует данные, а также классифицирует или классифицирует каждую строку в соответствии с некоторыми правил и, наконец, загружает их в ...
вопрос задан: 8 March 2012 19:45
0
ответов

Преимущества таких баз данных, как Greenplum или Vertica, по сравнению с MongoDB или Cassandra [закрыто]

В настоящее время я работаю над несколькими проектами с MongoDB и Apache Cassandra соответственно. Я также часто использую Solr и обрабатываю с ними "много" данных (примерно 1-2 ТБ). Я слышал о Greenplum ...
вопрос задан: 24 January 2012 13:36
0
ответов

Использование поля DATE в качестве первичного ключа измерения даты в MySQL

Я хочу обрабатывать измерение даты в хранилище данных MySQL. (Я новичок в мире DW). Я сделал несколько поисков в Google и увидел множество структур таблиц (большую часть) измерения даты, где ...
вопрос задан: 7 December 2011 13:06
0
ответов

Почему в таблицах Fact значения NULL отображаются как 0?

По какой причине в полях измерения в таблицах Fact (хранилищах данных с размерным моделированием) значения NULL обычно отображаются как 0?
вопрос задан: 28 November 2011 19:09
0
ответов

Какие преимущества имеет OLAP в памяти по сравнению с традиционными системами со значительным объемом памяти?

Имеют ли механизмы OLAP в памяти преимущества по сравнению с традиционными механизмами OLAP, поддерживаемыми достаточным объемом оперативной памяти, чтобы содержать весь куб (кубы)? Например, если я использую механизм MOLAP (SSAS) и ГБ / ТБ ОЗУ, где ...
вопрос задан: 6 November 2011 02:33
0
ответов

Реализация ролевых атрибутов. В SSAS?

У меня есть таблица фактов, который ссылается на мое измерение даты как дату формы, так и финансов даты. Следовательно, размер даты является ролью разных ролей. Это работает нормально, за исключением того, что я не могу ...
вопрос задан: 7 September 2011 20:45
0
ответов

Что означает «инкрементная загрузка»?

Я регулярно вижу выражение «инкрементная загрузка» при чтении статей Что это на самом деле (технически) означает? Что это означает? Приветствуются объяснения с использованием вариантов использования.
вопрос задан: 10 August 2011 21:01
0
ответов

Разница между транзакционной базой данных и базой данных отчетов

Один друг прокомментировал это так: Я бы порекомендовал выделить ваши транзакционные данные и данные отчетов в отдельную базу данных. Другой сказал мне: я бы реализовал схему ER в .. .
вопрос задан: 3 August 2011 22:36
0
ответов

В чем разница между СУБД и Hive? [закрыто]

В СУБД, такой как MySQL, есть база данных, есть ли база данных также в Улье? Как я читал в руководстве, в улье есть только таблица, я немного запутался в этом .. и в чем разница между концепцией СУБД и Улья? ...
вопрос задан: 2 August 2011 21:47
0
ответов

Что-нибудь похожее на MySQL Proxy для PostgreSQL?

Я ищу что-то похожее на MySQL Proxy. Цель - изменить входящие запросы на сервере. Я не ищу альтернативных способов добиться того же. На данный момент я лучше всего предполагаю ...
вопрос задан: 30 May 2011 22:43
0
ответов

Как создать таблицу фактов истории?

У меня есть несколько сущностей в моем хранилище данных: Person - с атрибутами personId, dateFrom, dateTo и другими, которые можно изменить, например фамилия, дата рождения и т. д. - медленно меняющееся измерение ...
вопрос задан: 22 May 2011 06:07
0
ответов

Таблицы календаря в PostgreSQL 9

Я создаю аналитическую базу данных (у меня есть четкое понимание данных и бизнес-целей, и я имею только базовые или умеренные навыки работы с базами данных). Я встречал некоторые упоминания о строительстве ...
вопрос задан: 28 April 2011 16:28
0
ответов

измерение даты / времени

Я разрабатываю хранилище данных, и у меня есть нерешенная проблема со временем. Мне нужно почасовое зерно (для расчета совокупного количества событий в час), и я также должен учесть схему смен, которая…
вопрос задан: 8 February 2011 11:34
0
ответов

альтернативы jpivot? [закрыто]

JPivot, даже при всей его функциональности, кажется немного устаревшим ... последняя версия на http://sourceforge.net/projects/jpivot/ от 17 марта 2008 г. ... есть ли другие легкий клиент olap cube ...
вопрос задан: 7 February 2011 02:46
0
ответов

Параметры ETL с Postgres [закрыто]

В настоящее время мы храним нашу базу данных postgres, используя SSIS, но есть определенные вещи, которые мы не можем делать, например, с провайдером ADO.Net невозможно использовать параметры в источнике данных потока данных ...
вопрос задан: 4 January 2011 19:10
0
ответов

Что лучше всего подходит для представления временных интервалов в хранилище данных?

В частности, я имею дело с медленно меняющимся измерением типа 2, и мне нужно представить временной интервал, в течение которого конкретная запись была активной для, т.е. для каждой записи у меня есть Дата начала и Дата окончания. ...
вопрос задан: 24 November 2010 08:57
0
ответов

Ссылочная целостность в реляционном хранилище данных. Стоит ли оно того? и каковы альтернативы?

Если бы вам пришлось создать реляционное хранилище данных библейских пропорций с помощью SQL Server 2008, вы бы использовали внешние ключи для обеспечения целостности данных или использовали бы другие средства? Люблю иностранные ...
вопрос задан: 11 October 2010 15:12
0
ответов

Хранилище данных произвольные поля

В нашем приложении мы поддерживаем плагины, написанные пользователем. Эти плагины генерируют данные различных типов (int, float, str или datetime), и эти данные помечаются пакетами метаданных (пользователь, текущий ...
вопрос задан: 27 September 2010 20:40
0
ответов

Python: interact со сложным хранилищем данных

Мы много работали над созданием полноразмерной модели базы данных нашей проблемы, и теперь пришло время начать кодирование. В наших предыдущих проектах использовались вручную созданные запросы, построенные по строке ...
вопрос задан: 25 September 2010 06:46
0
ответов

Хранилище данных: моделирование распределения рабочей нагрузки

У нас есть система, которая отслеживает распределение единицы работы, от получения этой единицы работы до завершения этой единицы работы. Единица работы имеет ряд атрибутов: источник, тип ...
вопрос задан: 22 September 2010 14:24
0
ответов

ETL с использованием Python

Я работаю над хранилищем данных и ищу решение ETL, использующее Python. Я играл со SnapLogic как с ETL, но мне было интересно, есть ли другие решения. Эти данные ...
вопрос задан: 22 September 2010 02:11
0
ответов

Что я должен иметь в виду при создании решения OLAP с нуля?

Я работаю в компании, использующей программный продукт на основе MS Сервер базы данных SQL, и за эти годы я разработал 20-30 довольно сложных отчетов на PHP, беря данные непосредственно из ...
вопрос задан: 16 September 2010 15:07