Объединение различных сходств для создания одного окончательного сходства

Я новичок в интеллектуальном анализе данных и системах рекомендаций, теперь пытаюсь создать что-то вроде системы rec для пользователей с такими параметрами:

  • город
  • образование
  • интерес

Чтобы вычислить сходство между ними, я буду применять косинусное сходство и дискретное сходство. Например:

  • город: если x = y, то d (x, y) = 0. В противном случае d (x, y) = 1.
  • образование: здесь я буду использовать косинусное сходство, поскольку слова появляются в названии факультета или степени бакалавра
  • Интерес: будет жестко запрограммировано количество интересующих пользователей, которое может выбрать пользователь, и косинусное сходство будет вычисляться на основе двух векторов, подобных этому:

1 0 0 1 0 0 ... n
1 1 1 0 1 0 ... n

где 1 m означает наличие интереса, а n - общее количество всех интересов.

У меня вопрос: Как объединить эти 3 сходства в соответствующем порядке? Я имею в виду, что просто их суммирование звучит не очень разумно, не так ли? Также я хотел бы услышать комментарии к моей «системе подобия новичков», ха.

6
задан CharlesB 20 November 2011 в 13:28
поделиться