У меня есть большое количество временных рядов (> 100), которые различаются по частоте выборки и времени период, в течение которого они доступны. Каждый временной ряд должен проверяться на единичные корни и сезонно ...
У меня есть PDF-файлы и CDF для двух пользовательских дистрибутивов, средство генерации случайных переменных для каждого и кода для подгонки параметров к данным. Часть этого кода я ранее размещал по адресу: Calculating ...
Для двух логических векторов, x и y, длиной> 1E8, каков самый быстрый способ вычисления перекрестных таблиц 2x2? Я подозреваю, что ответ - написать его на C / C ++, но мне интересно, есть ли что-нибудь в ...
В процессе кластеризации документа на этапе предварительной обработки данных я сначала применили сингулярное векторное разложение для получения U, S и Vt, а затем, выбрав su допустимое количество собственных значений, которые я усек ...
У меня есть наборы данных с двумя массивами данных одинаковой длины, или я могу создать массив из двух элементов, и я хотел бы вычислить корреляцию и статистическую значимость, представленные данными...
У меня есть квадратная матрица, которая представляет количество совпадений в наборе данных. Другими словами, строки представляют все возможные наблюдения за признаком 1, а столбцы - возможные ...
Я использую RandomForest пакет в R (R версии 2.13.1, RandomForest версия 4.6-2) для регрессии и заметили значительное смещение в моих результатах: ошибка прогнозирования зависит на стоимости ...
Я пытаюсь написать свой собственный код Python для вычисления t-статистики и p-значений для одного и два независимых t-теста. Я могу использовать нормальное приближение, но на данный момент я пытаюсь просто использовать...
I will be analysing vast amount of network traffic related data shortly, and will pre-process the data in order to analyse it. I have found that R and SPSS are among the most popular tools for ...
Мы планируем использовать MongoDB для хранения больших объемов аналитических данных, таких как просмотры и клики. Я не уверен, как лучше всего структурировать документы в MongoDB для облегчения запросов и сокращения ...
Быстрый вопрос. Я прочитал свой CSV-файл в переменные данные. Он имеет метку столбца var, которая имеет числовые значения. Когда я запускаю команду sd (data $ var), я получаю [1] NA вместо моего стандартного ...
Я не опытный программист, но я пытаюсь изменить способ отображения некоторых технических индикаторов в пакете финансовых диаграмм под названием TradeStation (не о конкретных диаграммах ...
У меня есть вектор наблюдаемых значений, а также вектор значений, рассчитанных с помощью модели :фактическое <-c (1411,439,214,100,62,38,29,64 )ожидаемое < -c (1425,3,399,5,201,6,116,9,72,2,46,3,30,4,64,8 )Теперь...
В настоящее время я работаю с тиковыми данными с R, и я хотел бы объединить дату и время в один объект, так как мне нужно получить объект точного времени для вычисления некоторой статистики по моим данным. Вот как мои данные...
Есть ли способ вычислить среднее и стандартное отклонение для вектора, содержащего образцы, с помощью Boost? Или мне нужно создать аккумулятор и передать в него вектор?
. Мне сложно собирать общедоступную статистику о проценте веб-пользователей, которые просматривают страницы с отключенным JavaScript. Yahoo опубликовал данные за 2010 год, а Р. Рейд опубликовал данные ...
Я новичок в R и SVM и пытаюсь профилировать функцию svm из пакета e1071. Однако я не могу найти большой набор данных, который позволил бы мне получить хороший диапазон результатов профилирования, различающийся размером ...
Это несколько вопросов новичков о статистическом программировании для R, для которых я не знаю ' не смог найти ответ в Интернете. В приведенном ниже коде мой фрейм данных помечен как "eitc". 1) Как только я загрузил ...
Кажется, я не могу найти библиотеки Python, которые выполняют множественную регрессию. Единственные вещи, которые я нахожу, делают только простую регрессию. Мне нужно регрессировать мою зависимую переменную (y )по нескольким независимым...
У меня есть фрейм данных pandas my_df, где я могу найти среднее (), медиану (), mode () данного столбца: my_df ['field_A']. Mean () my_df ['field_A']. Median () my_df ['field_A']. mode () Мне интересно, это ...
Я пытаюсь понять алгоритм OpenCV fitLine (). Это фрагмент кода из OpenCV :Функция icvFitLine2D -icvFitLine2D Я вижу, что есть какая-то случайная функция, которая выбирает точки для...
Мы работаем над сложным статистическим проектом на Java. Мы написали исходный код на языке программирования R. Есть ли способ преобразовать этот код в код Java (конвертер), или как мы можем…
Что интуитивно означает коэффициент корреляции? Если у меня есть серия X, а затем серия Y, и если я ввожу эти два в многослойный персептрон Weka, рассматривая Y как выход, а X как вход, я ...
В чем разница между структурированными и неструктурированными данными?
Как эта разница влияет на соответствующие подходы к интеллектуальному анализу данных?
Я пишу некоторые базовые методы нейронной сети -, в частности, функции активации -, и мои познания в математике достигли предела. Я понимаю соответствующие диапазоны (-1/1)(0/1 )и т. д.,...
У меня есть фрейм данных с несколькими столбцами: состояние
округ
год Затем x, y и z, где x, y и z - наблюдения, уникальные для триплета, указанного выше. Я ищу разумный способ сохранить это в ...
ВВЕДЕНИЕ: Я биоинформатик. В своем анализе, который я выполняю для всех генов человека (около 20 000), я ищу конкретный мотив короткой последовательности, чтобы проверить, сколько раз этот мотив встречается в каждом ...
Я часто сталкиваюсь с файлом, который имеет одно число в строке. В итоге я импортирую его в Excel, чтобы просмотреть такие вещи, как медиана, стандартное отклонение и так далее. Есть ли в linux утилита командной строки для...
После прочтения «Как не сортировать по средней оценке» мне стало любопытно, есть ли у кого-нибудь реализация на Python нижней границы доверительного интервала оценки Вильсона для параметра Бернулли?