Я новичок в этой области, а также в терминологии, поэтому, пожалуйста, не стесняйтесь предлагать, если я где-то ошибаюсь. У меня есть два таких набора данных:
A B C 0 E
A 0 C 0 0
A 0 C D E
A 0 C 0 E
Я интерпретирую это в какой-то момент времени, (A, B, C, E) произошли вместе, а также (A, C), (A , C, D, E) и т. Д.
5A 1B 5C 0 2E
4A 0 5C 0 0
2A 0 1C 4D 4E
3A 0 4C 0 3E
Я интерпретирую это так: в какой-то момент времени произошло 5 вхождений A, 1 вхождение B, 5 вхождений C и 2 вхождения E и т. д.
Я пытаюсь выяснить, какие элементы встречаются вместе, и, если возможно, также выяснить причину и следствие этого. Для этого я не понимаю, как использовать оба набора данных (или если одного достаточно). Было бы хорошо иметь хорошее руководство по этому вопросу, но мой главный вопрос заключается в том, какой набор данных использовать и как действовать в (i) построении частого набора элементов и (ii) построении правил ассоциации между ними.
Может ли кто-нибудь указать мне на практические руководства / примеры (желательно на Python) или хотя бы краткое объяснение того, как подойти к этой проблеме?