Скажите наивную запись студенческого метода создания как это:
void createStudent(String name) {
database.execute("INSERT INTO students (name) VALUES ('" + name + "')");
}
И кто-то вводит имя Robert'); DROP TABLE STUDENTS; --
, на Чем работают, база данных является этим запросом:
INSERT INTO students (name) VALUES ('Robert'); DROP TABLE STUDENTS --')
точка с запятой заканчивает команду вставки и запускает другого; - комментирует остальную часть строки. Команда DROP TABLE выполняется...
Поэтому связывают параметры, хорошая вещь.
Вы можете использовать любой IP-адрес или строка User-Agent, которую вам отправляет бот или веб-браузер.
Когда робот Googlebot (или большинство других добросовестных роботов) посещает ваш веб-сайт, они отправляют вам переменную $ _SERVER ['HTTP_USER_AGENT'], которая идентифицирует их. Вот несколько примеров:
Googlebot / 2.1 (+ http: текст ссылки текст ссылки
Затем вы можете использовать PHP для проверки этих строк пользовательского агента и определения, является ли пользователь поисковой системой или нет. Я часто использую что-то вроде этого:
$searchengines = array(
'Googlebot',
'Slurp',
'search.msn.com',
'nutch',
'simpy',
'bot',
'ASPSeek',
'crawler',
'msnbot',
'Libwww-perl',
'FAST',
'Baidu',
);
$is_se = false;
foreach ($searchengines as $searchengine){
if (!empty($_SERVER['HTTP_USER_AGENT']) and
false !== strpos(strtolower($_SERVER['HTTP_USER_AGENT']), strtolower($searchengine)))
{
$is_se = true;
break;
}
}
if ($is_se) { print('Its a search engine!'); }
Помните, что ни один метод обнаружения (Google Analytics, другой статистический пакет или иначе) не будет точным на 100%. Некоторые веб-браузеры позволяют вам устанавливать настраиваемую строку пользовательского агента, а некоторые неправильно работающие веб-сканеры могут вообще не отправлять строку пользовательского агента. Однако этот метод, вероятно, может быть эффективным для более 95% сканеров / посетителей.
Вы можете попытаться обнаружить их, используя строку их пользовательского агента. Их список можно найти здесь: http://www.botsvsbrowsers.com/
Поисковые системы обычно используют слова сканер и робот .
] Поисковые системы - почти единственный интернет-пользователь, который посещает robots.txt .
Есть несколько IP-адресов, которые известны как боты, такие как GoogleBot.
Альтернативы Google Analytics, которые позволяют хранить ваши данные:
Piwik реализован на PHP и работает так же, как GA . Два других - это анализаторы журналов веб-сервера.
Google Analytics позволит вам увидеть статистику сканирования вашего сайта.