Я сделал это, и я протестировал его, использование неподписанного интервала (32 бита) является самым быстрым - я предполагаю, что Вы сравниваете это со строковым представлением.
Другая вещь, которая могла бы помочь Вам, при составлении таблицы в прошлом, у меня было 2 colums: LowIP и HighIP; тем путем я был в состоянии поместить в черный список все диапазоны IP с 1 рекордной записью и все еще получить хорошую производительность путем проверки на IP в диапазоне.
Нанесите удар в темноте, если вы хотите обойти проблемы, связанные с метаданными и размером:
И многие другие.
В основном:
Преимущества:
Недостатки:
Ознакомьтесь с книгами по анализу изображений, такими как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется мириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
пятна дублируются независимо от кодировки, размера, формата, оттенка и изменения яркости, различий в динамическом диапазоне / субдискретизации и в некоторых случаях перспективыНедостатки:
Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется смириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
пятна дублируются независимо от кодировки, размера, формата, оттенка и изменения яркости, различий в динамическом диапазоне / субдискретизации и в некоторых случаях перспективыНедостатки:
Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, тогда все проще. Если нет, то вам придется смириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
изменение оттенка и яркости, различия в динамическом диапазоне / подвыборке и в некоторых случаях перспективаНедостатки:
Оформить заказ книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется смириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
изменение оттенка и яркости, различия в динамическом диапазоне / подвыборке и в некоторых случаях перспективаНедостатки:
Оформить заказ книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется смириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, тогда все проще. Если нет, то вам придется мириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, тогда все проще. Если нет, то вам придется мириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
ложные срабатывания вероятны, но их можно уменьшить с помощью нейронных сетей и другого ИИ.Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется смириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
ложные срабатывания вероятны, но их можно уменьшить с помощью нейронных сетей и другого ИИ.Книги по анализу изображений, такие как:
И другие
Если вы масштабируете изображение, все проще. Если нет, то вам придется мириться с тем фактом, что масштабирование приводит к потерям во многих отношениях, чем сокращение выборки.
Использование байтового размера изображения для сравнения подходит для многих приложений. Другой способ:
Ознакомьтесь с этой статьей о Надежном хешировании изображений .
Вы хотите выполнить хеширование изображения. Поскольку вы не указали конкретный язык, я предполагаю, что у вас нет предпочтений. По крайней мере, есть набор инструментов Matlab (бета), который может это сделать: http://users.ece.utexas.edu/~bevans/projects/hashing/toolbox/index.html . Большинство результатов Google по этому поводу являются результатами исследований, а не реальными библиотеками или инструментами.
Проблема с MD5 заключается в том, что MD5 очень чувствителен к небольшим изменениям входных данных, и похоже, что вы хотите что-то немного сделать » умнее ".
Довольно интересный вопрос. Самым быстрым и простым было бы вычисление crc32 массива байтов содержимого, но это будет работать только для 100% идентичных изображений. Для более интеллектуального сравнения вам, вероятно, понадобится какой-то анализ нечеткой логики ...
Я реализовал по крайней мере тривиальную версию этого. Я трансформирую и изменяю размер всех изображений до очень маленького (фиксированного размера) черно-белого эскиза. Затем я сравниваю их. Он обнаруживает точные, измененные по размеру и дубликаты, преобразованные в черно-белые. Он получает много дубликатов без больших затрат.
Проще всего сделать хэш (например, MD5) данных изображения, игнорируя все остальные метаданные. Вы можете найти множество библиотек с открытым исходным кодом, которые могут декодировать распространенные форматы изображений, поэтому довольно просто удалить метаданные.
Но это не работает, когда само изображение каким-либо образом манипулируется, включая масштабирование, вращение.
Чтобы делать именно то, что хотите, вы должны использовать водяные знаки для изображений, но это запатентовано и может быть дорогостоящим.
Это всего лишь идея: возможно, низкочастотные компоненты, присутствующие в DCT jpeg, могут использоваться в качестве идентификатора неизменного размера.