Как загрузить 100 миллионов строк с Azure устройство хранения данных Таблицы FAST

Question

Как загрузить 100 миллионов строк с Azure устройство хранения данных Таблицы FAST

Для меня определили задачу с загрузкой приблизительно 100 миллионов строк данных Azure устройство хранения данных Таблицы. Важная вещь, здесь являющаяся скоростью.

Процесс, который мы используем, загружает 10 000 строк с Azure устройство хранения данных Таблицы. Обработайте их в локальный экземпляр SQL-сервера. При обработке строк это удаляет 100 строк за один раз из таблицы Azure. Этот процесс является поточным, чтобы иметь 8 потоков, загружающих 10 000 строк за один раз.

Единственная проблема с этим - это согласно нашим вычислениям. Потребуется приблизительно 40 дней, чтобы загрузить и обработать эти приблизительно 100 миллионов строк, которые мы сохранили. Кто-либо знает более быстрый способ выполнить эту задачу?

Вопрос о стороне: Во время загрузки Azure процесса передаст обратно xml, который просто не имеет никаких данных. Это не передает ошибку обратно. Но это отправляет это:

<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<feed xml:base="azure-url/" xmlns:d="http://schemas.microsoft.com/ado/2007/08/dataservices" xmlns:m="http://schemas.microsoft.com/ado/2007/08/dataservices/metadata" xmlns="http://www.w3.org/2005/Atom">
  <title type="text">CommandLogTable</title>
  <id>azure-url/CommandLogTable</id>
  <updated>2010-07-12T19:50:55Z</updated>
  <link rel="self" title="CommandLogTable" href="CommandLogTable" />
</feed>
0

Кто-либо еще имеет эту проблему и имеет фиксацию для нее?

9

azure azure-storage azure-table-storage

задан jWoose 12 July 2010 в 19:59

6 ответов

Помимо предложений об ограничениях полосы пропускания, вы можете легко столкнуться с ограничениями учетной записи хранения, поскольку каждый раздел таблицы ограничен примерно 500 транзакциями в секунду.

Далее: развернута оптимизация (алгоритм Нэгла), которая действительно может замедлить выполнение небольших операций чтения (таких как чтение данных размером 1 КБ). Вот сообщение в блоге об отключении Nagling , которое потенциально может значительно ускорить чтение, особенно если вы работаете непосредственно в службе Azure без задержек в Интернете.

2