то, как обнаружить поисковую систему, посещает на моем сайте? как phpBB

Скажите наивную запись студенческого метода создания как это:

void createStudent(String name) {
    database.execute("INSERT INTO students (name) VALUES ('" + name + "')");
}

И кто-то вводит имя Robert'); DROP TABLE STUDENTS; --

, на Чем работают, база данных является этим запросом:

INSERT INTO students (name) VALUES ('Robert'); DROP TABLE STUDENTS --')

точка с запятой заканчивает команду вставки и запускает другого; - комментирует остальную часть строки. Команда DROP TABLE выполняется...

Поэтому связывают параметры, хорошая вещь.

5
задан coderex 20 July 2009 в 16:14
поделиться

4 ответа

Вы можете использовать любой IP-адрес или строка User-Agent, которую вам отправляет бот или веб-браузер.

Когда робот Googlebot (или большинство других добросовестных роботов) посещает ваш веб-сайт, они отправляют вам переменную $ _SERVER ['HTTP_USER_AGENT'], которая идентифицирует их. Вот несколько примеров:

Googlebot / 2.1 (+ http: текст ссылки текст ссылки

Затем вы можете использовать PHP для проверки этих строк пользовательского агента и определения, является ли пользователь поисковой системой или нет. Я часто использую что-то вроде этого:

$searchengines = array(
    'Googlebot', 
    'Slurp', 
    'search.msn.com', 
    'nutch', 
    'simpy', 
    'bot', 
    'ASPSeek', 
    'crawler', 
    'msnbot', 
    'Libwww-perl', 
    'FAST', 
    'Baidu', 
    );
$is_se = false;
foreach ($searchengines as $searchengine){
   if (!empty($_SERVER['HTTP_USER_AGENT']) and 
            false !== strpos(strtolower($_SERVER['HTTP_USER_AGENT']), strtolower($searchengine)))
    {
            $is_se = true;
            break;
    }
}
if ($is_se) { print('Its a search engine!'); } 

Помните, что ни один метод обнаружения (Google Analytics, другой статистический пакет или иначе) не будет точным на 100%. Некоторые веб-браузеры позволяют вам устанавливать настраиваемую строку пользовательского агента, а некоторые неправильно работающие веб-сканеры могут вообще не отправлять строку пользовательского агента. Однако этот метод, вероятно, может быть эффективным для более 95% сканеров / посетителей.

10
ответ дан 18 December 2019 в 13:17
поделиться
  1. Вы можете попытаться обнаружить их, используя строку их пользовательского агента. Их список можно найти здесь: http://www.botsvsbrowsers.com/

    Поисковые системы обычно используют слова сканер и робот .

  2. ] Поисковые системы - почти единственный интернет-пользователь, который посещает robots.txt .

  3. Есть несколько IP-адресов, которые известны как боты, такие как GoogleBot.

5
ответ дан 18 December 2019 в 13:17
поделиться

Альтернативы Google Analytics, которые позволяют хранить ваши данные:

Piwik реализован на PHP и работает так же, как GA . Два других - это анализаторы журналов веб-сервера.

0
ответ дан 18 December 2019 в 13:17
поделиться

Google Analytics позволит вам увидеть статистику сканирования вашего сайта.

-2
ответ дан 18 December 2019 в 13:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: