Сделать вложенные циклы более эффективными?

Я анализирую большие наборы данных, используя следующий сценарий:

M <- c_alignment 
c_check <- function(x){
    if (x == c_1) {
        1
    }else{
        0
    }
}
both_c_check <- function(x){
    if (x[res_1] == c_1 && x[res_2] == c_1) {
        1
    }else{
        0
    }
}
variance_function <- function(x,y){
    sqrt(x*(1-x))*sqrt(y*(1-y))
}
frames_total <- nrow(M)
cols <- ncol(M)
c_vector <- apply(M, 2, max)
freq_vector <- matrix(nrow = sum(c_vector))
co_freq_matrix <- matrix(nrow = sum(c_vector), ncol = sum(c_vector))
insertion <- 0
res_1_insertion <- 0
for (res_1 in 1:cols){
    for (c_1 in 1:conf_vector[res_1]){
        res_1_insertion <- res_1_insertion + 1
        insertion <- insertion + 1
        res_1_subset <- sapply(M[,res_1], c_check)
        freq_vector[insertion] <- sum(res_1_subset)/frames_total
        res_2_insertion <- 0
        for (res_2 in 1:cols){
            if (is.na(co_freq_matrix[res_1_insertion, res_2_insertion + 1])){
                for (c_2 in 1:max(c_vector[res_2])){
                    res_2_insertion <- res_2_insertion + 1
                    both_res_subset <- apply(M, 1, both_c_check)
                    co_freq_matrix[res_1_insertion, res_2_insertion] <- sum(both_res_subset)/frames_total
                    co_freq_matrix[res_2_insertion, res_1_insertion] <- sum(both_res_subset)/frames_total
                }
            }
        }
    }
}
covariance_matrix <- (co_freq_matrix - crossprod(t(freq_vector)))
variance_matrix <- matrix(outer(freq_vector, freq_vector, variance_function), ncol = length(freq_vector))
correlation_coefficient_matrix <- covariance_matrix/variance_matrix

Входные данные модели будут примерно такими:

1 2 1 4 3
1 3 4 2 1
2 3 3 3 1
1 1 2 1 2
2 3 4 4 2

Я вычисляю биномиальную ковариацию для каждого состояния, найденного в M [, i] с каждым состоянием, найденным в M [, j] . Каждая строка - это состояние, найденное для этого испытания, и я хочу увидеть, как состояния столбцов взаимно меняются.

Уточнение: я нахожу ковариацию двух полиномиальных распределений, но делаю это посредством биномиальных сравнений.

Входными данными является матрица 4200 x 510, а значение c для каждого столбца в среднем составляет около 15. Я знаю, что циклы для ужасно медленные в R, но я не уверен, как здесь можно использовать функцию apply . Если у кого-то есть предложения по правильному использованию здесь apply , я буду очень признателен. Сейчас сценарий занимает несколько часов. Спасибо!

5
задан Andrie 10 September 2014 в 19:59
поделиться