Более низкая производительность при использовании Eigen, чем при использовании моего собственного класса

Пару недель назад я задал вопрос о производительности умножения матриц.

] Мне сказали, что для повышения производительности моей программы я должен использовать некоторые специализированные классы матриц, а не свой собственный.

Пользователи StackOverflow рекомендуют:

  • uBLAS
  • EIGEN
  • BLAS

На Сначала я хотел использовать uBLAS, однако, прочитав документацию , выяснилось, что эта библиотека не поддерживает матричное умножение.

В конце концов я решил использовать библиотеку EIGEN. Поэтому я заменил свой матричный класс на Eigen :: MatrixXd - однако оказалось, что теперь мое приложение работает еще медленнее, чем раньше. Время до использования EIGEN составляло 68 секунд, а после замены моего матричного класса на EIGEN матричная программа работает в течение 87 секунд.

Части программы, которые занимают больше всего времени, выглядят так

TemplateClusterBase* TemplateClusterBase::TransformTemplateOne( vector& pointVector, Eigen::MatrixXd& rotation ,Eigen::MatrixXd& scale,Eigen::MatrixXd& translation )
{   
    for (int i=0;iassociatedTemplateIndex = i;
    }

    return this;
}

и

Eigen::MatrixXd AlgorithmPointBased::UpdateTranslationMatrix( int clusterIndex )
{
    double membershipSum = 0,outcome = 0;
    double currentPower = 0;
    Eigen::MatrixXd outcomePoint = Eigen::MatrixXd(2,1);
    outcomePoint << 0,0;
    Eigen::MatrixXd templatePoint;
    for (int i=0;i< imageDataVector.size();i++)
    {
        currentPower =0; 
        membershipSum += currentPower = pow(membershipMatrix[clusterIndex][i],m);
        outcomePoint.noalias() +=  (*imageDataVector[i] - (prototypeVector[clusterIndex]->rotationMatrix*prototypeVector[clusterIndex]->scalingMatrix* ( *templateCluster->templatePointVector[prototypeVector[clusterIndex]->assosiatedPointIndexVector[i]]) ))*currentPower ;
    }

    outcomePoint.noalias() = outcomePoint/=membershipSum;
    return outcomePoint; //.ConvertToMatrix();
}

Как видите, эти функции выполняет множество матричных операций. Вот почему я подумал, что использование Eigen ускорит мое приложение. К сожалению (как я уже упоминал выше), программа работает медленнее.

Есть ли способ ускорить эти функции?

Может быть, если бы я использовал матричные операции DirectX, я бы получил лучшую производительность ?? (однако у меня есть ноутбук со встроенной графической картой).

10
задан Cœur 19 August 2017 в 05:05
поделиться