Какой хороший пакет с открытым исходным кодом для создания гибкого обнаружения спама на большом сайте Rails?

Мой сайт становится больше и начинает привлекать много спама через различные каналы. На сайте есть множество различных типов пользовательского контента (профили, форумы, комментарии в блогах, обновления статуса, личные сообщения и т. д.). Я предпринимаю различные меры по смягчению последствий, которые я надеюсь развернуть в режиме блицкрига, чтобы убедить спамеров, что мы не Я очень уверен в том, что я делаю с точки зрения функциональности, но один недостающий элемент убивает весь старый спам сразу.

Вот что у меня есть:

  • Большой хороший / плохой корпус (5-значное плохо, 6 или 7-значное хорошо). Большая часть спама имеет очень надежные отпечатки пальцев, и тот факт, что я как бы игнорировал его в течение 6 месяцев, помогает :)
  • Большой модульный сайт Rails развернут в AWS . Это не очень посещаемый сайт, но мы запускаем 8 экземпляров с началами SOA.
  • Ruby, Redis, Resque, MySQL, Varnish, Nginx, Unicorn, Chef, все на Gentoo

Мои требования:

  1. Я хочу, чтобы он работал достаточно хорошо, учитывая объем данных (поэтому я опасаюсь чисто рубинового решения).
  2. Я должен уметь обучать несколько классификаций для разных типов контента (419-мошенничество против ссылки на ботнет спам)
  3. Я хотел бы иметь возможность добавлять вручную факторы, основанные на нашей собственной детективной работе (сопоставление с образцом, повторное использование IP и т.д.)
  4. В конечном итоге я хочу создать удобный интерфейс для использования с Ruby. Если для этого нужно запачкать руки в C или чем-то еще, я справлюсь, но я избегу этого, если смогу.

Я понимаю, что это длинный и расплывчатый вопрос, но в первую очередь я ищу просто список хороших пакетов и, во вторую очередь, любые случайные мысли кого-то, кто построил похожую систему, о способах к ней приблизиться.

6
задан gtd 3 June 2011 в 21:37
поделиться