0
ответов

Лучшие практики для эффективного анализа множественных временных рядов

У меня есть большое количество временных рядов (> 100), которые различаются по частоте выборки и времени период, в течение которого они доступны. Каждый временной ряд должен проверяться на единичные корни и сезонно ...
вопрос задан: 23 May 2017 11:51
0
ответов

DistributionFitTest [] для пользовательских дистрибутивов в Mathematica

У меня есть PDF-файлы и CDF для двух пользовательских дистрибутивов, средство генерации случайных переменных для каждого и кода для подгонки параметров к данным. Часть этого кода я ранее размещал по адресу: Calculating ...
вопрос задан: 23 May 2017 11:48
0
ответов

Самый быстрый способ построения перекрестных таблиц двух массивных логических векторов в R

Для двух логических векторов, x и y, длиной> 1E8, каков самый быстрый способ вычисления перекрестных таблиц 2x2? Я подозреваю, что ответ - написать его на C / C ++, но мне интересно, есть ли что-нибудь в ...
вопрос задан: 23 May 2017 10:29
0
ответов

К-кратная перекрестная проверка для определения k в k-средних?

В процессе кластеризации документа на этапе предварительной обработки данных я сначала применили сингулярное векторное разложение для получения U, S и Vt, а затем, выбрав su допустимое количество собственных значений, которые я усек ...
вопрос задан: 23 May 2017 10:28
0
ответов

Как в Python вычислить корреляцию и статистическую значимость между двумя массивами данных?

У меня есть наборы данных с двумя массивами данных одинаковой длины, или я могу создать массив из двух элементов, и я хотел бы вычислить корреляцию и статистическую значимость, представленные данными...
вопрос задан: 23 May 2017 02:23
0
ответов

Взаимная информация MATLAB Matrix

У меня есть квадратная матрица, которая представляет количество совпадений в наборе данных. Другими словами, строки представляют все возможные наблюдения за признаком 1, а столбцы - возможные ...
вопрос задан: 12 May 2017 05:00
0
ответов

RandomForest в R линейной регрессии хвосты mtry

Я использую RandomForest пакет в R (R версии 2.13.1, RandomForest версия 4.6-2) для регрессии и заметили значительное смещение в моих результатах: ошибка прогнозирования зависит на стоимости ...
вопрос задан: 13 April 2017 12:44
0
ответов

Отслеживание предположений, сделанных функцией `ttest_ind()` SciPy

Я пытаюсь написать свой собственный код Python для вычисления t-статистики и p-значений для одного и два независимых t-теста. Я могу использовать нормальное приближение, но на данный момент я пытаюсь просто использовать...
вопрос задан: 13 April 2017 12:44
0
ответов

R and SPSS difference

I will be analysing vast amount of network traffic related data shortly, and will pre-process the data in order to analyse it. I have found that R and SPSS are among the most popular tools for ...
вопрос задан: 4 April 2017 12:18
0
ответов

Подходы MongoDB для хранения больших объемов данных метрик / аналитики

Мы планируем использовать MongoDB для хранения больших объемов аналитических данных, таких как просмотры и клики. Я не уверен, как лучше всего структурировать документы в MongoDB для облегчения запросов и сокращения ...
вопрос задан: 29 March 2017 12:24
0
ответов

Получение «NA» при выполнении стандартного отклонения

Быстрый вопрос. Я прочитал свой CSV-файл в переменные данные. Он имеет метку столбца var, которая имеет числовые значения. Когда я запускаю команду sd (data $ var), я получаю [1] NA вместо моего стандартного ...
вопрос задан: 27 March 2017 03:40
0
ответов

Помощь в управлении колебаниями ценовых рядов (индикаторов) вокруг центрального значения

Я не опытный программист, но я пытаюсь изменить способ отображения некоторых технических индикаторов в пакете финансовых диаграмм под названием TradeStation (не о конкретных диаграммах ...
вопрос задан: 23 March 2017 00:27
0
ответов

Чи -квадрат критерия согласия в R

У меня есть вектор наблюдаемых значений, а также вектор значений, рассчитанных с помощью модели :фактическое <-c (1411,439,214,100,62,38,29,64 )ожидаемое < -c (1425,3,399,5,201,6,116,9,72,2,46,3,30,4,64,8 )Теперь...
вопрос задан: 8 March 2017 06:58
0
ответов

R тик данных :объединение даты и времени в один объект

В настоящее время я работаю с тиковыми данными с R, и я хотел бы объединить дату и время в один объект, так как мне нужно получить объект точного времени для вычисления некоторой статистики по моим данным. Вот как мои данные...
вопрос задан: 10 January 2017 00:02
0
ответов

Вычислить среднее и стандартное отклонение от вектора выборок в C ++ с использованием Boost

Есть ли способ вычислить среднее и стандартное отклонение для вектора, содержащего образцы, с помощью Boost? Или мне нужно создать аккумулятор и передать в него вектор?
вопрос задан: 17 December 2016 18:04
0
ответов

Статистика браузера по JavaScript отключена [закрыто]

. Мне сложно собирать общедоступную статистику о проценте веб-пользователей, которые просматривают страницы с отключенным JavaScript. Yahoo опубликовал данные за 2010 год, а Р. Рейд опубликовал данные ...
вопрос задан: 30 November 2016 17:33
0
ответов

Профилирование SVM (e1071) в R

Я новичок в R и SVM и пытаюсь профилировать функцию svm из пакета e1071. Однако я не могу найти большой набор данных, который позволил бы мне получить хороший диапазон результатов профилирования, различающийся размером ...
вопрос задан: 11 November 2016 07:56
0
ответов

Язык R: Как мне распечатать / просмотреть сводную статистику для подмножества выборки?

Это несколько вопросов новичков о статистическом программировании для R, для которых я не знаю ' не смог найти ответ в Интернете. В приведенном ниже коде мой фрейм данных помечен как "eitc". 1) Как только я загрузил ...
вопрос задан: 7 November 2016 19:41
0
ответов

Множественная линейная регрессия в Python

Кажется, я не могу найти библиотеки Python, которые выполняют множественную регрессию. Единственные вещи, которые я нахожу, делают только простую регрессию. Мне нужно регрессировать мою зависимую переменную (y )по нескольким независимым...
вопрос задан: 25 September 2016 19:11
0
ответов

Панды: найти процентиль статистику данного столбца

У меня есть фрейм данных pandas my_df, где я могу найти среднее (), медиану (), mode () данного столбца: my_df ['field_A']. Mean () my_df ['field_A']. Median () my_df ['field_A']. mode () Мне интересно, это ...
вопрос задан: 19 September 2016 20:50
0
ответов

Какой из MATLAB и Python подходит для статистического анализа? [closed]

Какой из двух языков подходит для статистического анализа? Какие плюсы и минусы, кроме доступности, у каждого из них?
вопрос задан: 10 July 2016 23:18
0
ответов

Алгоритм подбора линии OpenCV

Я пытаюсь понять алгоритм OpenCV fitLine (). Это фрагмент кода из OpenCV :Функция icvFitLine2D -icvFitLine2D Я вижу, что есть какая-то случайная функция, которая выбирает точки для...
вопрос задан: 29 March 2016 20:23
0
ответов

с использованием программирования R в java

Мы работаем над сложным статистическим проектом на Java. Мы написали исходный код на языке программирования R. Есть ли способ преобразовать этот код в код Java (конвертер), или как мы можем…
вопрос задан: 19 January 2016 09:10
0
ответов

Что на самом деле представляет коэффициент корреляции [закрыто]

Что интуитивно означает коэффициент корреляции? Если у меня есть серия X, а затем серия Y, и если я ввожу эти два в многослойный персептрон Weka, рассматривая Y как выход, а X как вход, я ...
вопрос задан: 17 January 2016 11:12
0
ответов

Как различаются структурированные и неструктурированные данные?

В чем разница между структурированными и неструктурированными данными? Как эта разница влияет на соответствующие подходы к интеллектуальному анализу данных?
вопрос задан: 17 January 2016 11:12
0
ответов

Функции нейронной активации -Разница между логистикой/тангом/и т. д.

Я пишу некоторые базовые методы нейронной сети -, в частности, функции активации -, и мои познания в математике достигли предела. Я понимаю соответствующие диапазоны (-1/1)(0/1 )и т. д.,...
вопрос задан: 5 January 2016 03:17
0
ответов

Хранение сложных временных рядов в R

У меня есть фрейм данных с несколькими столбцами: состояние округ год Затем x, y и z, где x, y и z - наблюдения, уникальные для триплета, указанного выше. Я ищу разумный способ сохранить это в ...
вопрос задан: 3 December 2015 21:47
0
ответов

Распределения аппроксимации, степень согласия, значение p. Можно ли сделать это с помощью Scipy (Python)?

ВВЕДЕНИЕ: Я биоинформатик. В своем анализе, который я выполняю для всех генов человека (около 20 000), я ищу конкретный мотив короткой последовательности, чтобы проверить, сколько раз этот мотив встречается в каждом ...
вопрос задан: 19 November 2015 08:22
0
ответов

утилита командной строки для печати статистики чисел в linux

Я часто сталкиваюсь с файлом, который имеет одно число в строке. В итоге я импортирую его в Excel, чтобы просмотреть такие вещи, как медиана, стандартное отклонение и так далее. Есть ли в linux утилита командной строки для...
вопрос задан: 12 October 2015 10:37
0
ответов

Реализация интервала оценки Уилсона на Python?

После прочтения «Как не сортировать по средней оценке» мне стало любопытно, есть ли у кого-нибудь реализация на Python нижней границы доверительного интервала оценки Вильсона для параметра Бернулли?
вопрос задан: 11 September 2015 07:18