Я новичок в интеллектуальном анализе данных и системах рекомендаций, теперь пытаюсь создать что-то вроде системы rec для пользователей с такими параметрами:
Чтобы вычислить сходство между ними, я буду применять косинусное сходство и дискретное сходство. Например:
1 0 0 1 0 0 ... n
1 1 1 0 1 0 ... n
где 1
m означает наличие интереса, а n
- общее количество всех интересов.
У меня вопрос: Как объединить эти 3 сходства в соответствующем порядке? Я имею в виду, что просто их суммирование звучит не очень разумно, не так ли? Также я хотел бы услышать комментарии к моей «системе подобия новичков», ха.