Как я могу извлечь наименее коррелированные столбцы?

Вы также можете попробовать получить изображение, если хотите, исходя из высоты или ширины

https://graph.facebook.com/user_id/picture?height=

ИЛИ

https://graph.facebook.com/user_id/picture?width=

Значения по умолчанию в пикселях вам просто нужно указать значение int

2
задан brute 13 July 2018 в 08:22
поделиться

1 ответ

Поскольку у вас несколько пар, это лучший способ, я думаю:

rs = r2.stack()
rs_min = rs[rs <= rs.min() + 1e-4] # I added some tolerance here
cols = rs_min.index.values

С вашими данными это дает мне

>>> rs_min.index.values
array([(0, 3), (2, 3), (3, 0), (3, 2)], dtype=object)

Если вы хотите сплюснутый список уникальных значений, вы можете преобразовать массив:

vals = list(set(item[1] for item in vals))

(вы можете использовать item[0] или item[1], потому что пары все равно симметричны), что дает

>>> list(set(item[1] for item in vals))
[0, 2, 3]

Исходя из ваших таблиц, обратите внимание, что Excel и Pandas дают разные результаты для корреляции. Этот код предполагает, что Pandas дает правильные результаты.

EDIT:

Если вы хотите вернуть исходные данные результатов, вы можете сделать

print(data[:, vals])

Это должно дать вам ваш результат.

2
ответ дан irene 17 August 2018 в 13:29
поделиться
  • 1
    Вы можете уточнить? Я думал, что вам нужны имена столбцов (которые были в r2 как числа), у которых были самые низкие значения r ^ 2. Что вы подразумеваете под «столбчатыми данными»? – irene 13 July 2018 в 08:01
  • 2
    О, так что вы также хотите получить самые низкие значения R ^ 2, в дополнение к столбцам [0,2,3]? – irene 13 July 2018 в 08:11
  • 3
    Столбец 0 на самом деле является вашим индексом , вот почему. Позвольте мне это исправить. – irene 13 July 2018 в 08:12
  • 4
  • 5
    см. мое редактирование, вы поймете – brute 13 July 2018 в 08:22
Другие вопросы по тегам:

Похожие вопросы: