Что лучший способ состоит в том, чтобы программно обнаружить изображения порно? [закрытый]

Кажется, вы устанавливаете placeholder текст в полях ввода неправильно. Пожалуйста, сделайте следующее:

<span class="SignUpText">
    @Html.TextBoxFor(m => m.Name, new { placeholder="Name" })
</span>
<span class="SignUpText">
    @Html.TextBoxFor(m => m.Email, new { placeholder="E-mail" })
</span>

Теперь вам не нужно ничего делать с jQuery.

120
задан Andy 2 August 2017 в 16:15
поделиться

18 ответов

Это было записано в 2000, не уверенный, если состояние в обнаружении порно совершенствовалось вообще, но я сомневаюсь относительно этого.

http://www.dansdata.com/pornsweeper.htm

PORNsweeper, кажется, имеет некоторую способность отличить изображения людей из изображений вещей, которые не являются людьми, пока изображения в цвете. Это менее успешно при различении грязных изображений людей от чистых.

Со значением по умолчанию, средней чувствительностью, если Человеческие ресурсы отправляет вокруг изображения нового парня в Учетных записях, у Вас есть приблизительно 50%-й шанс получения его. Если Ваша сестра отправит Вам изображение ее шестимесячный, то оно, столь же вероятно, будет задержано.

Только справедливо указать на забавные ошибки, как вызов порно Моны Лизы, если они являются представительными для поведения программного обеспечения. Если производители признают, что их алгоритмическое устройство распознавания изображения допустит ошибку 15% времени, то высмеивающий его, когда это делает точно, который глуп.

Но PORNsweeper только, кажется, соответствует своим установленным спецификациям в одном отделе - обнаружение фактического порно. Это на полпути достойно при обнаружении порно, но это плохо при обнаружении чистых изображений. И я не был бы удивлен, не были ли никакие главные прыжки сделаны в этой области в ближайшем будущем.

69
ответ дан 24 November 2019 в 01:36
поделиться

Взгляд на имя файла и любые атрибуты. Существует совсем не достаточно информации для обнаружения даже 20% непослушных изображений, но простой черный список ключевого слова, по крайней мере, обнаружил бы изображения с описательными маркировками или метаданными. 20 минут кодирования для 20%-го показателя успешности не являются мошенничеством, тем более, что предварительный экран, который может, по крайней мере, поймать некоторые простые перед передачей остальных модератору для оценки.

Другой полезный прием является противоположным, конечно, поддержите белый список источников изображения для разрешения без модерирования или проверки. Если большинство Ваших изображений прибывает из известных безопасных загрузчиков или источников, можно просто принять их bindly.

0
ответ дан 24 November 2019 в 01:36
поделиться

Обнаружение изображений порно является все еще определенной задачей AI, которая является очень теоретической все же.

Получите коллективную власть и агентурную разведку путем добавления кнопки/ссылки "Report spam/abuse". Или используйте несколько модераторов, чтобы сделать это задание.

P.S. Действительно удивленный, сколько люди задают программному обеспечению принятия вопросов и алгоритмам, все-могущественные, даже не думая, могло ли то, что они хотят, быть сделано. Они - представители той новой породы программистов, у которых нет понимания аппаратных средств, низкоуровневого программирования и всего этого "волшебства позади"?

P.S. № 2. Я также помню, что периодически это происходит, что некоторая ситуация, когда сами люди не могут решить, является ли изображение порно или искусством, взята в суд. Даже после регламента суда, возможности являются половиной людей, рассмотрит решение неправильно. Последняя глупая ситуация вида состояла совсем недавно в том, когда страница Wikipedia была запрещена в Великобритании из-за изображения обложки диска это функции некоторая нагота.

1
ответ дан 24 November 2019 в 01:36
поделиться

Я видел, что сеть фильтрует приложение, которое делает фильтрацию изображения порно, извините я не могу помнить имя. Это было довольно подвержено ложным положительным сторонам однако большую часть времени, это работало.

Я думаю, что основной прием обнаруживает "слишком много кожи на изображении :)

1
ответ дан 24 November 2019 в 01:36
поделиться

Добавьте оскорбительную ссылку и сохраните md5 (или другой хеш) незаконного изображения так, чтобы это могло автоматически отмеченный на будущем.

Насколько прохладный это было бы, если бы у кого-то была большая общедоступная база данных изображения md5 наряду с описательными тегами, работающими как веб-сервис? Много порно не является исходной работой (в этом человек, у которого есть она теперь, вероятно, не сделал его), и популярные изображения имеют тенденцию плавать вокруг различных мест, таким образом, это могло действительно иметь значение.

4
ответ дан 24 November 2019 в 01:36
поделиться

короткий ответ: используйте модератора ;)

Длинный ответ: Я не думаю, что существует проект по этой причине, что такое порно? Только участки, полная нагота, карлики и т.д. Его субъективное.

4
ответ дан 24 November 2019 в 01:36
поделиться

Две опции, о которых я могу думать (хотя ни один из них программно не обнаруживает порно):

  1. Блокируют все загруженные изображения, пока один из Ваших администраторов не посмотрел на них. Нет никакой причины, почему это должно занять много времени: Вы могли записать некоторое программное обеспечение, которое показывает 10 изображений в секунду, почти как фильм - даже на этой скорости, для человека легко определить потенциально порнографическое изображение. Затем Вы перематываетесь в этом программном обеспечении и более внимательно рассмотрели.
  2. Добавьте обычный "флаг это изображение как несоответствующая" опция.
1
ответ дан 24 November 2019 в 01:36
поделиться

Я позволил бы пользовательский отчет о плохих изображениях. Разработка распознавания изображений может взять слишком много усилия и время и не будет так же так же точна как человеческие глаза. Намного более дешево произвести то задание модерирования на стороне.

Смотрите на: Amazon Mechanical Turk

"Amazon Mechanical Turk (MTurk) является одним из комплекта Amazon Web Services, краудсорсинговый рынок, который позволяет компьютерным программам скоординировать использование агентурной разведки для выполнения задач, которые компьютеры не могут сделать".

45
ответ дан 24 November 2019 в 01:36
поделиться

Ответ действительно легок: довольно безопасно сказать, что это не будет возможно за следующие два десятилетия. Перед этим мы, вероятно, получим хорошие инструментальные средства для перевода. В прошлый раз, когда я проверил, парни AI изо всех сил пытались определить тот же автомобиль на двух выстрелах фотографий от немного измененного угла. Смотрите на том, сколько времени это взяло их для собирания достаточно хорошего OCR или распознавания речи. Это - проблемы распознавания, которые могут извлечь выгоду значительно из словарей и все еще далеки от наличия абсолютно надежных решений несмотря на многомиллионные месяцы человека, брошенные в них.

Это сказанное Вы могли просто добавить "наступление?" ссылка рядом со сгенерированным пользователем спорит и имеет перекрестную проверку модификации входящие жалобы.

править:

Я забыл что-то: ЕСЛИ Вы соберетесь реализовать некоторый фильтр, то Вам будет нужен надежный. Если Вашим решением было бы 50%-е право, 2000 из 4 000 пользователей с достойными изображениями будет заблокирован. Ожидайте негодование.

5
ответ дан 24 November 2019 в 01:36
поделиться

Существует программное обеспечение, которое обнаруживает вероятность для порно, но это не точная наука, поскольку компьютеры не могут распознать то, что находится на самом деле на изображениях (изображения являются только большим множеством значений на сетке без значения). Можно ли просто преподавать компьютер, что такое порно и что не путем предоставления примеров. Это имеет недостаток, что он только распознает эти или подобные изображения.

Учитывая повторяющуюся природу порно у Вас есть хороший шанс при обучении системы с немногими ложными положительными сторонами. Например, при обучении системы с голыми людьми, она может отметить изображения пляжа "почти" с явными людьми как порно также.

Подобное программное обеспечение является программным обеспечением Facebook, которое недавно вышло. Это просто специализировано на поверхностях. Основной принцип является тем же.

Технически Вы реализовали бы некоторый анализатор, который использует байесовую фильтрацию. Анализатор может искать функции как процент плоти, окрашенной пикселями, если это - простой детектор или просто вычисляет подобие текущего изображения с рядом сохраненных образов порно.

Это, конечно, не ограничено порно, это - на самом деле больше угловой случай. Я думаю более распространенный, системы, которые пытаются найти другие вещи в изображениях ;-)

8
ответ дан 24 November 2019 в 01:36
поделиться

Нет никакого способа, которым Вы могли сделать это 100% (я скажу, возможно, что 1-5% были бы вероятны) с в наше время знанием. Вы получили бы намного лучший результат (чем те 1-5%) просто проверка названий картинки для сексуальных связанных слов :).

Сообщение-розыгрыш @SO: Таким образом верный.

-1
ответ дан 24 November 2019 в 01:36
поделиться

На самом деле это довольно просто. Вы можете обнаружить программно тона кожи - и порно изображения, как правило, имеет много кожи. Это приведет к ложным срабатываниям, но если это проблема, вы можете передать изображения, обнаруженные таким образом, через фактическую модерацию. Это не только значительно сокращает работу для модераторов, но и дает много свободного порно. Это беспроигрышный вариант.

#!python    
import os, glob
from PIL import Image

def get_skin_ratio(im):
    im = im.crop((int(im.size[0]*0.2), int(im.size[1]*0.2), im.size[0]-int(im.size[0]*0.2), im.size[1]-int(im.size[1]*0.2)))
    skin = sum([count for count, rgb in im.getcolors(im.size[0]*im.size[1]) if rgb[0]>60 and rgb[1]<(rgb[0]*0.85) and rgb[2]<(rgb[0]*0.7) and rgb[1]>(rgb[0]*0.4) and rgb[2]>(rgb[0]*0.2)])
    return float(skin)/float(im.size[0]*im.size[1])

for image_dir in ('porn','clean'):
    for image_file in glob.glob(os.path.join(image_dir,"*.jpg")):
        skin_percent = get_skin_ratio(Image.open(image_file)) * 100
        if skin_percent>30:
            print "PORN {0} has {1:.0f}% skin".format(image_file, skin_percent)
        else:
            print "CLEAN {0} has {1:.0f}% skin".format(image_file, skin_percent)

Этот код измеряет оттенки кожи в центре изображения. Я тестировал на 20 относительно ручных «порно» образов и 20 совершенно невинных изображений. Она флаги 100% от «порно» и 4 из 20 чистых изображений. Это довольно высокий процент ложных срабатываний, но сценарий старается быть достаточно осторожным и может быть дополнительно доработан. Он работает со светлой, темной и азиатской кожей.

It ' Основные недостатки ложных срабатываний - коричневые объекты, такие как песок и дерево, и, конечно же, он не знает разницы между «непослушной» и «красивой» плотью (например, снимки лица).

Слабость с ложно-отрицательными результатами - это изображения без особого содержания. обнаженная кожа (например, кожаная бондаж), окрашенная или татуированная кожа, черно-белые изображения и т. д.

исходный код и образцы изображений

89
ответ дан 24 November 2019 в 01:36
поделиться

Я слышал об инструментах, которые использовали очень простой, но довольно эффективный алгоритм. Алгоритм рассчитал относительное количество пикселей со значением цвета, близким к некоторым предопределенным цветам «кожи». Если эта сумма превышает некоторое заданное значение, то изображение считается эротического / порнографического содержания. Конечно, этот алгоритм даст ложноположительные результаты для фотографий лица крупным планом и многого другого.
Поскольку вы пишете о социальных сетях, там будет много «нормальных» фотографий с большим количеством цвета кожи, поэтому вам не следует использовать этот алгоритм, чтобы отклонять все фотографии с положительным результатом. Но вы можете использовать его предоставить некоторую помощь для модераторов, например, флаг этих изображений с более высоким приоритетом, поэтому если модератор хочет проверить некоторые новые фотографии для порнографического содержания, он может начать с этих картин.

1
ответ дан 24 November 2019 в 01:36
поделиться

Идеально подходит для этого API веб-службы BrightCloud . Это REST API для подобного поиска на веб-сайтах. Он содержит очень большую и очень точную фильтрацию веб-БД и одной из категорий, взрослый, имеет более чем 10 миллионов порносайтовы идентифицированные!

1
ответ дан 24 November 2019 в 01:36
поделиться

Сегодня я не буду пытаться определить виды материала I понять, что тебя обнимают сокращенное описание ["жесткий порнография "], и, возможно, я мог бы никогда не удается вразумительно делать так. Но я знаю это, когда вижу это, и фильм, участвующий в этом дело не в этом.

- Судья Верховного суда США Поттер Стюарт, 1964

0
ответ дан 24 November 2019 в 01:36
поделиться

БУМ! Вот технический документ , содержащий алгоритм.

Кто-нибудь знает, где взять исходный код для реализации java (или любого другого языка)?

Это потрясло бы.

Один алгоритм называется WISE имеет уровень точности 98%, но вероятность ложных срабатываний 14%. Итак, что вы делаете, вы позволяете пользователям отмечать 2% ложных срабатываний, в идеале с автоматическим удалением, если это отметит определенное количество пользователей, и заставляете модераторов просматривать 14% ложных срабатываний.

15
ответ дан 24 November 2019 в 01:36
поделиться

Если у вас действительно есть время и деньги:

Один из способов сделать это - 1) написать алгоритм обнаружения изображения, чтобы найти, является ли объект человеком или нет. Это можно сделать битовой маскировкой изображения, чтобы получить его "контуры" и посмотреть, подходят ли контуры к человеческому контуру.

2) Множество порно-изображений извлекается из данных и используются методы интеллектуального анализа данных, такие как алгоритмы C4 или Оптимизация роя частиц, чтобы научиться обнаруживать закономерности, совпадающие с порнографическими изображениями.

Для этого необходимо определить, как должен выглядеть обнаженный мужчина/женщина контур человеческого тела в цифровом формате (это может быть достигнуто таким же образом, как работают алгоритмы распознавания образов OCR).

Надеюсь, вам будет весело! :-)

2
ответ дан 24 November 2019 в 01:36
поделиться

Этот выглядит многообещающим. В основном они обнаруживают кожу (с калибровкой путем распознавания лиц) и определяют «пути кожи» (т. Е. Измеряют пропорцию пикселей кожи по сравнению с пикселями кожи лица / пикселями кожи). У этого приличная производительность. http://www.prip.tuwien.ac.at/people/julian/skin-detection

1
ответ дан 24 November 2019 в 01:36
поделиться
Другие вопросы по тегам:

Похожие вопросы: