Предположим, у меня есть данные, указанные ниже.
11:00 user1 Brush
11:05 AM user1 Prep Brakfast
11:10 AM user1 eat Breakfast
11:15 AM user1 Принять ванну
11:30 AM user1 Выйти в офис
12:00 user2 Brush
12:05 user2 Prep Brakfast
12:10 PM user2 eat Breakfast
12:15 user2 Принять ванну
12:30 user2 Выйти в офис
11:00 user3 Принять ванну
11:05 user3 Приготовить завтрак
11:10 AM user3 Brush
11:15 AM user3 съесть завтрак
11:30 user3 Выйти в офис
12:00 user4 Принять ванну
12:05 user4 Prep Brakfast
12: 22:00 user4 Brush
12:15 user4 завтракает
12:30 user4 Выйти в офис
Эти данные говорят мне о распорядке дня разных людей. Из этих данных кажется, что user1 и user2 ведут себя одинаково (хотя есть разница во времени, когда они выполняют действие, но они следуют той же последовательности). По той же причине User3 и User4 ведут себя одинаково. Теперь мне нужно сгруппировать таких пользователей в разные группы. В этом примере group1- user1 и USer2 ..., а затем group2, включая user3 и user4
Как мне подходить к подобной ситуации. Я пытаюсь изучить интеллектуальный анализ данных, и это пример, который я считал проблемой интеллектуального анализа данных. Я пытаюсь найти подход к решению, но не могу его придумать. Я считаю, что в этих данных есть закономерность. но я не могу придумать подход, который может выявить это. Кроме того, я должен сопоставить этот подход с имеющимся у меня набором данных, который довольно велик, но похож на этот :) возникновение событий одновременно. И я хочу найти группы, представляющие подобную последовательность событий.
Любые указатели приветствуются.