Получение 100 лучших URL-адресов из лог-файла

Одному из моих друзей в интервью задали следующий вопрос. Может ли кто-нибудь сказать мне, как это решить?

У нас есть довольно большой лог-файл, около 5 ГБ. Каждая строка файла журнала содержит URL-адрес, который пользователь посетил на нашем сайте. Мы хотим выяснить, какие из 100 самых популярных URL-адресов посещают наши пользователи. Как это сделать?

5
задан Animesh Porwal 24 May 2012 в 08:42
поделиться