Я пишу фрагмент кода для оценки моих Алгоритм кластеризации, и я обнаружил, что для любого метода оценки требуются базовые данные из матрицы m * n
, например A = {aij}
, где aij
- это число точек данных, которые являются членами класса ci
и элементами кластера kj
.
Но в Introduction to Data Mining (Pang-Ning Tan et al.), Похоже, есть две матрицы этого типа: одна - это матрица неточностей, другая - это таблица непредвиденных обстоятельств. Я не совсем понимаю разницу между ними. Что лучше всего описывает матрицу, которую я хочу использовать?