statistics - список вопросов по программированию statistics

0

ответов

Лучшие практики для эффективного анализа множественных временных рядов

У меня есть большое количество временных рядов (> 100), которые различаются по частоте выборки и времени период, в течение которого они доступны. Каждый временной ряд должен проверяться на единичные корни и сезонно ...

r matlab statistics time-series

вопрос задан: 23 May 2017 11:51

0

ответов

DistributionFitTest [] для пользовательских дистрибутивов в Mathematica

У меня есть PDF-файлы и CDF для двух пользовательских дистрибутивов, средство генерации случайных переменных для каждого и кода для подгонки параметров к данным. Часть этого кода я ранее размещал по адресу: Calculating ...

statistics wolfram-mathematica probability

вопрос задан: 23 May 2017 11:48

0

ответов

Самый быстрый способ построения перекрестных таблиц двух массивных логических векторов в R

Для двух логических векторов, x и y, длиной> 1E8, каков самый быстрый способ вычисления перекрестных таблиц 2x2? Я подозреваю, что ответ - написать его на C / C ++, но мне интересно, есть ли что-нибудь в ...

performance r statistics crosstab bigdata

вопрос задан: 23 May 2017 10:29

0

ответов

К-кратная перекрестная проверка для определения k в k-средних?

В процессе кластеризации документа на этапе предварительной обработки данных я сначала применили сингулярное векторное разложение для получения U, S и Vt, а затем, выбрав su допустимое количество собственных значений, которые я усек ...

python statistics numpy nlp machine-learning

вопрос задан: 23 May 2017 10:28

0

ответов

Как в Python вычислить корреляцию и статистическую значимость между двумя массивами данных?

У меня есть наборы данных с двумя массивами данных одинаковой длины, или я могу создать массив из двух элементов, и я хотел бы вычислить корреляцию и статистическую значимость, представленные данными...

correlation numpy python scipy statistics

вопрос задан: 23 May 2017 02:23

0

ответов

Взаимная информация MATLAB Matrix

У меня есть квадратная матрица, которая представляет количество совпадений в наборе данных. Другими словами, строки представляют все возможные наблюдения за признаком 1, а столбцы - возможные ...

matlab matrix statistics information-theory

вопрос задан: 12 May 2017 05:00

0

ответов

RandomForest в R линейной регрессии хвосты mtry

Я использую RandomForest пакет в R (R версии 2.13.1, RandomForest версия 4.6-2) для регрессии и заметили значительное смещение в моих результатах: ошибка прогнозирования зависит на стоимости ...

r random-forest statistics regression

вопрос задан: 13 April 2017 12:44

0

ответов

Отслеживание предположений, сделанных функцией `ttest_ind()` SciPy

Я пытаюсь написать свой собственный код Python для вычисления t-статистики и p-значений для одного и два независимых t-теста. Я могу использовать нормальное приближение, но на данный момент я пытаюсь просто использовать...

algorithm python statistics

вопрос задан: 13 April 2017 12:44

0

ответов

R and SPSS difference

I will be analysing vast amount of network traffic related data shortly, and will pre-process the data in order to analyse it. I have found that R and SPSS are among the most popular tools for ...

r statistics spss data-analysis

вопрос задан: 4 April 2017 12:18

0

ответов

Подходы MongoDB для хранения больших объемов данных метрик / аналитики

Мы планируем использовать MongoDB для хранения больших объемов аналитических данных, таких как просмотры и клики. Я не уверен, как лучше всего структурировать документы в MongoDB для облегчения запросов и сокращения ...

database-design mongodb statistics analytics

вопрос задан: 29 March 2017 12:24

0

ответов

Получение «NA» при выполнении стандартного отклонения

Быстрый вопрос. Я прочитал свой CSV-файл в переменные данные. Он имеет метку столбца var, которая имеет числовые значения. Когда я запускаю команду sd (data $ var), я получаю [1] NA вместо моего стандартного ...

r statistics na stdev

вопрос задан: 27 March 2017 03:40

0

ответов

Помощь в управлении колебаниями ценовых рядов (индикаторов) вокруг центрального значения

Я не опытный программист, но я пытаюсь изменить способ отображения некоторых технических индикаторов в пакете финансовых диаграмм под названием TradeStation (не о конкретных диаграммах ...

algorithm statistics language-agnostic trading tradestation

вопрос задан: 23 March 2017 00:27

0

ответов

Чи -квадрат критерия согласия в R

У меня есть вектор наблюдаемых значений, а также вектор значений, рассчитанных с помощью модели :фактическое <-c (1411,439,214,100,62,38,29,64 )ожидаемое < -c (1425,3,399,5,201,6,116,9,72,2,46,3,30,4,64,8 )Теперь...

chi-squared goodness-of-fit r statistics

вопрос задан: 8 March 2017 06:58

0

ответов

R тик данных :объединение даты и времени в один объект

В настоящее время я работаю с тиковыми данными с R, и я хотел бы объединить дату и время в один объект, так как мне нужно получить объект точного времени для вычисления некоторой статистики по моим данным. Вот как мои данные...

finance r statistics time-series

вопрос задан: 10 January 2017 00:02

0

ответов

Вычислить среднее и стандартное отклонение от вектора выборок в C ++ с использованием Boost

Есть ли способ вычислить среднее и стандартное отклонение для вектора, содержащего образцы, с помощью Boost? Или мне нужно создать аккумулятор и передать в него вектор?

c++ algorithm boost statistics mean

вопрос задан: 17 December 2016 18:04

0

ответов

Статистика браузера по JavaScript отключена [закрыто]

. Мне сложно собирать общедоступную статистику о проценте веб-пользователей, которые просматривают страницы с отключенным JavaScript. Yahoo опубликовал данные за 2010 год, а Р. Рейд опубликовал данные ...

javascript statistics cross-browser

вопрос задан: 30 November 2016 17:33

0

ответов

Профилирование SVM (e1071) в R

Я новичок в R и SVM и пытаюсь профилировать функцию svm из пакета e1071. Однако я не могу найти большой набор данных, который позволил бы мне получить хороший диапазон результатов профилирования, различающийся размером ...

bioinformatics r statistics svm machine-learning

вопрос задан: 11 November 2016 07:56

0

ответов

Язык R: Как мне распечатать / просмотреть сводную статистику для подмножества выборки?

Это несколько вопросов новичков о статистическом программировании для R, для которых я не знаю ' не смог найти ответ в Интернете. В приведенном ниже коде мой фрейм данных помечен как "eitc". 1) Как только я загрузил ...

r statistics stata

вопрос задан: 7 November 2016 19:41

0

ответов

Множественная линейная регрессия в Python

Кажется, я не могу найти библиотеки Python, которые выполняют множественную регрессию. Единственные вещи, которые я нахожу, делают только простую регрессию. Мне нужно регрессировать мою зависимую переменную (y )по нескольким независимым...

numpy python scipy statistics linear-regression

вопрос задан: 25 September 2016 19:11

0

ответов

Панды: найти процентиль статистику данного столбца

У меня есть фрейм данных pandas my_df, где я могу найти среднее (), медиану (), mode () данного столбца: my_df ['field_A']. Mean () my_df ['field_A']. Median () my_df ['field_A']. mode () Мне интересно, это ...

python python-2.7 pandas statistics

вопрос задан: 19 September 2016 20:50

0

ответов

Какой из MATLAB и Python подходит для статистического анализа? [closed]

Какой из двух языков подходит для статистического анализа? Какие плюсы и минусы, кроме доступности, у каждого из них?

python matlab statistics analysis

вопрос задан: 10 July 2016 23:18

0

ответов

Алгоритм подбора линии OpenCV

Я пытаюсь понять алгоритм OpenCV fitLine (). Это фрагмент кода из OpenCV :Функция icvFitLine2D -icvFitLine2D Я вижу, что есть какая-то случайная функция, которая выбирает точки для...

algorithm curve-fitting opencv statistics

вопрос задан: 29 March 2016 20:23

0

ответов

с использованием программирования R в java

Мы работаем над сложным статистическим проектом на Java. Мы написали исходный код на языке программирования R. Есть ли способ преобразовать этот код в код Java (конвертер), или как мы можем…

java r statistics

вопрос задан: 19 January 2016 09:10

0

ответов

Что на самом деле представляет коэффициент корреляции [закрыто]

Что интуитивно означает коэффициент корреляции? Если у меня есть серия X, а затем серия Y, и если я ввожу эти два в многослойный персептрон Weka, рассматривая Y как выход, а X как вход, я ...

math machine-learning statistics weka

вопрос задан: 17 January 2016 11:12

0

ответов

Как различаются структурированные и неструктурированные данные?

В чем разница между структурированными и неструктурированными данными? Как эта разница влияет на соответствующие подходы к интеллектуальному анализу данных?

machine-learning statistics

вопрос задан: 17 January 2016 11:12

0

ответов

Функции нейронной активации -Разница между логистикой/тангом/и т. д.

Я пишу некоторые базовые методы нейронной сети -, в частности, функции активации -, и мои познания в математике достигли предела. Я понимаю соответствующие диапазоны (-1/1)(0/1 )и т. д.,...

function neural-network statistics math machine-learning

вопрос задан: 5 January 2016 03:17

0

ответов

Хранение сложных временных рядов в R

У меня есть фрейм данных с несколькими столбцами: состояние округ год Затем x, y и z, где x, y и z - наблюдения, уникальные для триплета, указанного выше. Я ищу разумный способ сохранить это в ...

r statistics dataframe time-series

вопрос задан: 3 December 2015 21:47

0

ответов

Распределения аппроксимации, степень согласия, значение p. Можно ли сделать это с помощью Scipy (Python)?

ВВЕДЕНИЕ: Я биоинформатик. В своем анализе, который я выполняю для всех генов человека (около 20 000), я ищу конкретный мотив короткой последовательности, чтобы проверить, сколько раз этот мотив встречается в каждом ...

python numpy scipy statistics probability

вопрос задан: 19 November 2015 08:22

0

ответов

утилита командной строки для печати статистики чисел в linux

Я часто сталкиваюсь с файлом, который имеет одно число в строке. В итоге я импортирую его в Excel, чтобы просмотреть такие вещи, как медиана, стандартное отклонение и так далее. Есть ли в linux утилита командной строки для...

command-line statistics linux

вопрос задан: 12 October 2015 10:37

0

ответов

Реализация интервала оценки Уилсона на Python?

После прочтения «Как не сортировать по средней оценке» мне стало любопытно, есть ли у кого-нибудь реализация на Python нижней границы доверительного интервала оценки Вильсона для параметра Бернулли?

algorithm python ranking statistics

вопрос задан: 11 September 2015 07:18