Частое использование интеллектуального анализа наборов элементов для построения правил ассоциации?

Я новичок в этой области, а также в терминологии, поэтому, пожалуйста, не стесняйтесь предлагать, если я где-то ошибаюсь. У меня есть два таких набора данных:

Набор данных 1:

A B C 0 E
A 0 C 0 0
A 0 C D E
A 0 C 0 E

Я интерпретирую это в какой-то момент времени, (A, B, C, E) произошли вместе, а также (A, C), (A , C, D, E) и т. Д.

Набор данных 2:

5A 1B 5C  0 2E
4A  0 5C  0  0
2A  0 1C 4D 4E
3A  0 4C  0 3E

Я интерпретирую это так: в какой-то момент времени произошло 5 вхождений A, 1 вхождение B, 5 вхождений C и 2 вхождения E и т. д.

Я пытаюсь выяснить, какие элементы встречаются вместе, и, если возможно, также выяснить причину и следствие этого. Для этого я не понимаю, как использовать оба набора данных (или если одного достаточно). Было бы хорошо иметь хорошее руководство по этому вопросу, но мой главный вопрос заключается в том, какой набор данных использовать и как действовать в (i) построении частого набора элементов и (ii) построении правил ассоциации между ними.

Может ли кто-нибудь указать мне на практические руководства / примеры (желательно на Python) или хотя бы краткое объяснение того, как подойти к этой проблеме?

24
задан Legend 13 August 2011 в 00:17
поделиться