Как я могу извлечь наименее коррелированные столбцы?

Question

Как я могу извлечь наименее коррелированные столбцы?

Вы также можете попробовать получить изображение, если хотите, исходя из высоты или ширины

https://graph.facebook.com/user_id/picture?height=

ИЛИ

https://graph.facebook.com/user_id/picture?width=

Значения по умолчанию в пикселях вам просто нужно указать значение int

2

python pandas numpy scipy

задан brute 13 July 2018 в 08:22

1 ответ

Другие вопросы по тегам:
python pandas numpy scipy

Похожие вопросы:

145
Скрытые возможности Python [закрыто] - 23 May 2017 12:34

81
Лучшие способы учить новичка к программе? [закрытый] - 24 November 2011 00:03

60
Как разбить список на куски одинакового размера? - 23 May 2017 11:55

35
Почему изучают Perl, Python, Ruby, если компания использует C++, C# или Java как язык приложения? [закрытый] - 20 May 2010 08:15

34
Распространенные ошибки в Python [дубликат] - 23 May 2017 10:30

33
Важные реверсивные пары leetcode time out [duplicate] - 25 October 2014 10:12

31
Не удалось узнать номер телефона с кодом страны, используя REGEX в python [duplicate] - 22 March 2017 17:18

score 2 · Answer 1

Поскольку у вас несколько пар, это лучший способ, я думаю:

rs = r2.stack()
rs_min = rs[rs <= rs.min() + 1e-4] # I added some tolerance here
cols = rs_min.index.values

С вашими данными это дает мне

>>> rs_min.index.values
array([(0, 3), (2, 3), (3, 0), (3, 2)], dtype=object)

Если вы хотите сплюснутый список уникальных значений, вы можете преобразовать массив:

vals = list(set(item[1] for item in vals))

(вы можете использовать item[0] или item[1], потому что пары все равно симметричны), что дает

>>> list(set(item[1] for item in vals))
[0, 2, 3]

Исходя из ваших таблиц, обратите внимание, что Excel и Pandas дают разные результаты для корреляции. Этот код предполагает, что Pandas дает правильные результаты.

EDIT:

Если вы хотите вернуть исходные данные результатов, вы можете сделать

print(data[:, vals])

Это должно дать вам ваш результат.

2

ответ дан irene 17 August 2018 в 13:29

1

Вы можете уточнить? Я думал, что вам нужны имена столбцов (которые были в r2 как числа), у которых были самые низкие значения r ^ 2. Что вы подразумеваете под «столбчатыми данными»? – irene 13 July 2018 в 08:01
2

О, так что вы также хотите получить самые низкие значения R ^ 2, в дополнение к столбцам [0,2,3]? – irene 13 July 2018 в 08:11
3

Столбец 0 на самом деле является вашим индексом , вот почему. Позвольте мне это исправить. – irene 13 July 2018 в 08:12

4

Давайте продолжим обсуждение в чате . – irene 13 July 2018 в 08:17

5

см. мое редактирование, вы поймете – brute 13 July 2018 в 08:22