Стандартный и надежный способ отследить подписчиков RSS?

Что лучший способ состоит в том, чтобы отследить подписчиков RSS надежно, не используя Feedburner? Некоторые очевидные подходы как отслеживание IP или количеством хитов имеют некоторые дефекты актов. IP-адреса могут измениться с каждым запросом, или многочисленные пользователи могут использовать тот же IP. Кроме того, программы чтения новостных лент могут запросить канал многократно в день или даже час. Обе проблемы делают его действительно трудно для получения надежной статистики на уникальных подписчиках.

Я прочитал статьи и Leo Notenboom и Tim Bray по теме, но ни одно из их предложений, кажется, действительно не решает, как отследить подписчиков точным и надежным способом. Leo предлагает генерировать уникальный идентификатор программно, чтобы быть добавленным к URL канала RSS в течение каждого раза, когда относящаяся страница загружается. Защитники Tim иметь RSS-ридеры генерируют уникальный хэш-тег, и также имеет предложения в пределах от отслеживания ссылающихся доменов к использованию cookie. Уникальный URL был бы надежен, но он имеет два дефекта: это не удобный для пользователя URL, и это создает дублирующееся содержание для SEO. Есть ли какие-либо другие надежные методы отслеживания подписчиков RSS? Как Feedburner оценивает подписчиков?

10
задан VirtuosiMedia 26 July 2010 в 18:01
поделиться

4 ответа

Вы можете запросить журналы вашего веб-сервера о посещаемости вашего RSS-канала, возможно, отфильтровать его по IP, чтобы получить количество обращений.

Проблема в том, что это зависит от людей, ежедневно проверяющих ленту. Частота посещений RSS-ленты одним человеком может варьироваться от дня к дню, и число может быть меньше.

0
ответ дан 4 December 2019 в 02:25
поделиться

На самом деле нет стандартного способа сделать это. Подсчет подписчиков всегда ненадежен, но с его помощью можно получить хорошие оценки.

Вот как это делает Google ( источник ):

Количество подписчиков рассчитывается путем сопоставления IP-адреса и считывателя каналов. комбинации, а затем, используя наше детальное понимание множества читатели, агрегаторы и боты на рынке, чтобы сделать дополнительные выводы.

Конечно, отчасти это легко для Google, поскольку они могут сначала подсчитать, сколько пользователей Google Reader подписано на рассматриваемый канал. После этого они также используют сопоставление IP-адресов, и это то, что вы тоже должны использовать.

Вы можете вычислить отдельные IP-адреса (т.е. уникальные) из журналов веб-серверов, но это будет считать 10 человек за 1, если все они будут использовать один и тот же адрес. Вот почему вы должны проверять HTTP-заголовки, которые отправляет клиент, а точнее поля заголовка HTTP_X_FORWARDED_FOR и HTTP_VIA . Вы можете использовать адрес HTTP_VIA в качестве «основного» адреса, а затем подсчитать, сколько уникальных адресов HTTP_X_FORWARDED_FOR подписано на канал. Если у подписчика нет этих полей для добавления прокси, он считается уникальным IP-адресом. Это должно быть обработано в коде, который генерирует фид. Вы также можете добавить поиск по IP-адресу для IP-адресов и сохранить все в базе данных. Это позволит вам увидеть, в какой стране больше всего подписчиков на ваш канал.

Здесь тоже есть проблемы.Все прокси не используют эти поля, и это не решает проблемы с подсчетом подписчиков за шлюзами NAT. Однако это хорошая оценка. Кроме того, вас, вероятно, больше интересует порядок величины, а не точное количество подписчиков, не так ли? Если счетчик показывает, что у вас 5989 подписчиков, вероятно, у вас больше подписчиков, поскольку счетчик дает вам нижнюю границу.

4
ответ дан 4 December 2019 в 02:25
поделиться

Если вы настроите RSS-канал так, чтобы он требовал аутентификации, вы сможете делать метрики на основе пользователя вместо метрик на основе ip. Хотя это технически правильное решение, заставить людей зайти в аутентифицированный блог в любом другом сценарии, кроме интранет, будет проблематично.

0
ответ дан 4 December 2019 в 02:25
поделиться

Standard и Reliable не совсем то слово в словаре RSS :-) Нужно помнить, что у этой штуки даже нет стандартного XSD спустя сколько лет? Если под отслеживанием вы подразумеваете "подсчет", есть несколько вещей, которые вы можете сделать, и тактика зависит от цели, т.е. вы демонстрируете большое число или маленькое? Это маркетинговая вещь, поэтому вы должны определить свои цели :-)

Возможно, для начала вам придется классифицировать IP номера - чтобы иметь основную коллекцию больших / корпоративных / зонтичных IP номеров. Для них вы можете использовать referrer как разумный критерий фильтрации и считать все остальное уникальным, если не доказано обратное. Подавляющее большинство IP-номеров остаются стабильными в течение примерно 2 дней, но, опять же, всегда полезно использовать базовую логику referrer в качестве фильтра для людей, которые просто продолжают "кликать", так сказать.

Затем вам нужен приличный список агрегаторов и классификация того, как они обрабатывают URL, и если они полностью скрывают конечных читателей, то вам нужны либо опубликованные, либо выведенные средние значения - всегда справедливо использовать справедливое распределение среднего числа. Использование cookies может помочь собрать IP-адреса агрегаторов и провести различие между автоматизированными агентами и частными лицами.

Очень важно помнить, что нельзя использовать только один метод и ожидать, что он будет серебряной пулей - необходимо использовать эти 3-4 аспекта одновременно плюс базовые статистические рассуждения.

4
ответ дан 4 December 2019 в 02:25
поделиться