Для вычисления корреляции Пирсона между моментами и характеристиками вы должны использовать:
textstat_simil(x, method = “correlation”, margin = “features”)
Документация проясняет это довольно четко, и метод корреляции используется по умолчанию.
Корреляция Пирсона не будет наиболее подходящей для двоичных данных, и в настоящее время мы не применяем методы Спирмена или другие методы корреляции, более подходящие для категориальных или порядковых данных. Однако вы всегда можете привести dfm к обычной матрице (используйте as.matrix()
), а затем использовать методы stats::cor()
, в том числе методы Спирмена.
Что касается последнего вопроса, мы используем стандартную реализацию этих мер. Если вы хотите получить более четкое представление о том, что они означают, я предлагаю задать вопрос о перекрестной проверке.
Хорошо, этот вопрос должен быть закрыт как not-programming-related, это - действительно вопрос для предстоящего "родственного" сайта, но я собираюсь попытаться ответить на это так или иначе. Теперь я никогда не использовал MySQL, и кто-то может, вероятно, сделать лучший ответ.
Позволяет запускаются с поиска Google
(5 минут спустя... решил сделать решающий шаг, после только просматривают чтение нескольких результатов),
20 минут, сделанных.
Теперь у нас есть пошаговые инструкции для выполнения нескольких экземпляров MySQL на единственной машине, которая, вероятно, поднимется как первый результат в Google в следующий раз, когда любой ищет его ;)