В моей компании ежемесячно поступает около 24 миллионов изображений от производителей. Я искал быстрое решение для того, чтобы изображения, которые мы загружаем в наш каталог, были новыми изображениями.
Я хочу сказать, что я искал в Интернете повсюду, чтобы попытаться найти идеальное решение. Я даже разработал свой собственный алгоритм обнаружения краев.
Я оценил скорость и точность нескольких моделей. Мои изображения с белым фоном очень хорошо работают с фишингом. Как сказал redcalx , я рекомендую phash или ahash. НЕ использовать хеширование MD5 или любые другие криптографические хеши. Если только вам не нужны ТОЧНЫЕ совпадения изображений. Любое изменение размера или манипуляция между изображениями приведет к другому хешу.
Для phash / ahash, проверьте это: imagehash
Я хотел расширить пост * redcalx *, опубликовав свой код и мою точность.
Что я делаю:
from PIL import Image
from PIL import ImageFilter
import imagehash
img1=Image.open(r"C:\yourlocation")
img2=Image.open(r"C:\yourlocation")
if img1.width
Вот некоторые из моих результатов:
item1 item2 totalaccuracy
desk1 desk2 3
desk2 phone1 22
chair1 desk1 17
phone1 chair1 34
где элемент представляет фактический объект изображения, а число представляет масштаб ориентации . [+1112]
Надеюсь, это поможет!
Это плохое сообщение об ошибке, но ваша проблема является распространенной - вы должны указать Set data = getClipboardData ()
при возврате объекта.