Найдите ряд данных, используя неточные измерения (нечеткая логика)

Это более сложный вопрос на ответ: Эффективный способ поиска последовательных значений

Каждый Продукт может иметь много Сегмент строк (тысячи). Каждый сегмент имеет столбец позиции , который начинается с 1 для каждого продукта (1, 2, 3, 4, 5 и т. Д.), И столбец значения , который может содержать любые значения, такие как ( 323.113, 5423.231, 873.42, 422.64, 763.1 и т. Д.). Данные доступны только для чтения.

Может быть полезно думать о продукте как о песне, а о фрагментах - как о наборе музыкальных нот в песне.

Учитывая подмножество смежных сегментов, например отрывок из песни, я хотел бы определить потенциальные соответствия для продуктов. Однако из-за потенциальных ошибок в измерениях сегменты в подмножестве могут не точно соответствовать сегментам в базе данных .

Как я могу идентифицировать продукты-кандидаты, найдя сегменты продуктов, которые наиболее точно соответствуют подмножеству сегментов, которые я измерил? Кроме того, является ли база данных лучшим носителем для этого типа данных?

-

Вот лишь некоторые мысли о том, как я собирался подойти к этой проблеме. Пожалуйста, не воспринимайте это как точные требования. Я открыт для любых алгоритмов, чтобы сделать эту работу как можно лучше.Я думал, что для определения близости должно быть несколько пороговых переменных. Одна возможность может заключаться в реализации порога близости и порога совпадения .

Например, с учетом этих значений:

Product A contains these segments: 11,21,13,13,15.
Measurement 1 has captured: 20,14,14,15.
Measurement 2 has captured: 11,21,78,13.
Measurement 3 has captured: 15,13,21,13,11.

Если порог близости позволял измеренному сегменту быть на 1 выше или ниже фактического сегмента, то Измерение 1 может соответствовать Продукту А, потому что, хотя многие сегменты не совпадают точно , они находятся в пределах порога близости относительно фактических значений.

Если порог совпадения разрешен для измерений с совпадениями 3 или более, Измерение 2 может вернуть Продукт A, потому что, хотя один из сегментов (78) намного превышает порог близости, он все еще соответствует 3 сегментам. в правильном порядке и поэтому находится в пределах порогового значения соответствия .

Измерение 3 не будет соответствовать Продукту A, потому что, хотя все измеренные сегменты существуют в фактических сегментах, они не находятся в пределах близости или соответствия пороговым значениям.

Обновление: Один из ответов попросил меня определить, что я имею в виду под , наиболее точно соответствует . Я не совсем уверен, как на это ответить, но постараюсь объяснить, продолжая аналогию с песней. Скажем, сегменты представляют максимальные частоты записанной песни. Если я снова запишу ту же самую песню, она будет похожей, но из-за фонового шума и других ограничений записывающего оборудования некоторые частоты будут совпадать, некоторые будут близкими, а некоторые - далеко.В этом сценарии, как бы вы определили, когда одна запись «совпадает» с другой? Это та же самая логика сопоставления, которую я ищу для решения этой проблемы.

7
задан Community 23 May 2017 в 12:29
поделиться