Функция расстояния для смешанных переменных (категориальных и числовых)

Я хочу нечеткую кластеризацию набора вакансий . Атрибуты вакансий :

  1. Категориальные : должность, диплом, навыки
  2. Числовые : зарплата, стаж

Мой вопрос: как рассчитать расстояние между разными вакансии?
например job1 (программист, бакалавр информатики, (java, .net, ответственность), 1500, 3)
и job2 (тестировщик, bs computer science, (тестирование черного и белого ящика), 1200,1)

PS: Я новичок в кластеризации интеллектуального анализа данных, я высоко ценю вашу помощь.

9
задан Brian Tompsett - 汤莱恩 16 January 2016 в 01:31
поделиться