Я ищу некоторые технологии к исследованию. Я поражен, что можно войти [вставляют большой сайт здесь] 'S-интерфейс, обновляют установку, и в течение секунд это выставлено так, это живо через плату. Хорошим примером этого является adwords. Если Вы входите в adwords и изменяете кампанию, те настройки хранятся на сервере с уникальным идентификатором. Код рекламы называет сервер с тем идентификатором, и информация (размер, цвета, и т.д.) потянулась немедленно для показа рекламы. То, как тот Google, может выставить это к сотням тысяч серверов так быстро? Какие системы дб они используют?
Компания Google опубликовала исследовательские работы по своим Google File System (или "BigFiles", как она когда-то называлась) и BigTable, которые широко используются в ее сервисах. Эти документы, вероятно, будут полезны для чтения, как сами по себе, так и потому, что они, вероятно, цитируют известный уровень техники.
Возможно, вы захотите прочитать, как Oracle построила RAC для распространения данных по многим БД: http://download.oracle.com/docs/cd/B14117_01/server.101/ b10727 / ha_strea.htm
Я знаю, что Facebook использует одноранговую сеть для отправки обновлений на свой сервер.
Первый сервер получает обновление, затем он отправляет его некоторым другим, которые делают то же самое ... и так до тех пор, пока обновление не будет на всех их серверах!
Я искал похожие фрагменты информации.
Ищите «Структурированные данные».
Особенности: MojoDB, CouchDB. Поищите сравнения на сайте mojodb.
Facebook сделал Cassandra (распределенная база данных) открытым исходным кодом. Думаю, они и многие другие сейчас этим пользуются.
Также обратите внимание на фреймворк Hadoop и Map / Reduce, как предмет интереса.