0
ответов

Каковы способы определения вероятностей в скрытых марковских моделях?

Я начинаю изучать скрытые марковские модели, и на вики-странице, а также на github есть много примеров, но большинство вероятностей уже есть (70% изменение дождя, 30% вероятность ...
вопрос задан: 28 October 2011 19:25
0
ответов

Реализация теста Колмогорова Смирнова в python scipy

У меня есть набор данных по N числам, которые я хочу проверить на нормальность. Я знаю, что scipy.stats имеет функцию kstest , но нет примеров того, как его использовать и как интерпретировать результаты. Кто-нибудь здесь ...
вопрос задан: 26 October 2011 15:06
0
ответов

Корреляционная близость слов

Допустим, у меня есть текстовая расшифровка диалога за период приблизительно. 1 час. Я хочу знать, какие слова встречаются в непосредственной близости друг от друга. Какой тип статистической техники я бы использовал ...
вопрос задан: 23 October 2011 18:28
0
ответов

Самый простой способ создать график нерегулярных временных рядов (R? GGPLOT? ITS?)

Я графический дизайнер, который пытается использовать R для создания графиков, которые слишком сложны для Excel. Я специально пытаюсь создать диаграмму шагов нерегулярного временного ряда. У меня не было проблем с созданием ...
вопрос задан: 20 October 2011 11:39
0
ответов

Несколько частотных линий на одном графике, где y - символьное значение

Я пытаюсь создать частотный график количества появлений графического типа по годам. Я какое-то время играл с ggplot2, но думаю, что это выше моей головы (я только начинаю с ...
вопрос задан: 17 October 2011 21:58
0
ответов

Алгоритм поиска кластеров (мин. X точек на расстоянии y от центра кластера) географических точек

Учитывая базу данных географических местоположений (долгота / широта), какой будет лучший подход к определению / обнаружению кластеров местоположений которые находятся в пределах x миль от центра кластера И всего не менее y ...
вопрос задан: 17 October 2011 16:20
0
ответов

НЛТК / НЛП построение предметного классификатора "многие-ко-многим" / с несколькими ярлыками

У меня есть помеченный людьми корпус из более чем 5000 тематические индексированные документы в XML. Они различаются по размеру от нескольких сотен килобайт до нескольких сотен мегабайт. Краткие статьи к рукописям. У них ...
вопрос задан: 15 October 2011 19:32
0
ответов

График Excel - Категория и Группировка по подкатегориям

Я редко, если вообще когда-либо, использую Excel и не имею глубокого понимания графиков и связанных с ними функций. Сказав это ... у меня есть десятки строк данных, состоящих из 4 столбцов столбец 1 = количество / цена (...
вопрос задан: 10 October 2011 14:48
0
ответов

filemtime () [function.filemtime]: stat не удалось для имен файлов с умляутами

Я использую функцию PHP filemtime, чтобы получить время последней модификации с PHP 5.3. Эта функция работает очень хорошо, но, похоже, возникают некоторые проблемы, когда имена файлов содержат специальные символы (для ...
вопрос задан: 3 October 2011 18:56
0
ответов

Статистика R - проблемы с памятью при выделении большой матрицы / Linux

Я прочитал несколько тем о проблемах с памятью в R и не могу найти решения к моей проблеме. Я использую своего рода регрессию LASSO для нескольких подмножеств большого набора данных. Для некоторых подмножеств ...
вопрос задан: 26 September 2011 18:44
0
ответов

Почему SciPy возвращает отрицательные p-значения для чрезвычайно малых p-значений с помощью точного критерия Фишера?

Я заметил, что метод точности Фишера тест в SciPy возвращает отрицательное p-значение, если p-значение чрезвычайно мало: >>> import scipy as sp >>> import scipy.stats >>> x = [[48 , ...
вопрос задан: 21 September 2011 17:43
0
ответов

k-means: одинаковые кластеры для каждого выполнения

Можно ли получить одинаковые кластеры kmeans для каждого выполнения для определенного набора данных. Как и для случайного значения, мы можем использовать фиксированное начальное число. Можно ли остановить случайность для кластеризации?
вопрос задан: 21 September 2011 14:04
0
ответов

SQL, почему SELECT COUNT (*), MIN (col), MAX (col) быстрее, чем SELECT MIN (col), MAX (col)

Мы видим огромную разницу между этими запросами. Медленный запрос SELECT MIN (col) AS Firstdate, MAX (col) AS Lastdate FROM table WHERE status = 'OK' AND fk = 4193 Table 'table'. Счетчик сканирований 2, ...
вопрос задан: 21 September 2011 11:20
0
ответов

Точность, почему Matlab и Python numpy дают такие разные результаты?

Я знаю об основных типах данных и о том, что типы с плавающей запятой (float, double) не могут точно содержать некоторые числа . Однако при переносе некоторого кода из Matlab в Python (Numpy) я обнаружил некоторые существенные различия в ...
вопрос задан: 20 September 2011 11:56
0
ответов

Как реализовать R 'r'sjust в Python

У меня есть список p-значения, и я хотел бы рассчитать настройку P-значения для нескольких сравнений для FDR Отказ В R, я могу использовать: pval <- read.csv ("my_file.txt", заголовок = f, sep = "\ t") PVAL <- PVAL [...
вопрос задан: 17 September 2011 00:11
0
ответов

Есть ли разница между «конечным автоматом» и «конечным автоматом»?

Я не уверен, что понимаю, есть ли разница между конечным автоматом и Государственный аппарат? Я слишком много об этом думаю?
вопрос задан: 12 September 2011 10:11
0
ответов

Методы разделения и сопоставления с рисунком

Я новичок в искусственных нейронных сетях. Я заинтересован в таком случае: у меня значительно большой набор объектов. Каждый объект имеет шесть свойств, обозначаемых P1-P6. Каждый ...
вопрос задан: 5 September 2011 10:22
0
ответов

Oracle - Вам нужно рассчитывать статистику после создания индекса или добавления столбцов?

Мы используем Oracle 10.2.0.5 база данных в производстве. Оптимизатор работает в «экономичном» режиме. Нужно ли нам рассчитывать статистику (пакет DBMS_STATS) после: создания нового индекса добавления столбца создания ...
вопрос задан: 2 September 2011 21:19
0
ответов

Исключение Solr в stats.field?

Можно пометить определенные фильтры и исключить эти фильтры при фасетировании. Обычно это требуется при фасетировании с множественным выбором. Возможно ли что-то подобное для stats.field? stats.field = {! ex = ...
вопрос задан: 30 August 2011 07:24
0
ответов

Реализация многомерной гауссовской функции плотности вероятности для> 2 измерений в C ++

Я работаю над реализацией функции плотности вероятности многомерной гауссовской функции в C ++, и я застрял на том, как лучше всего справиться со случаями, когда размерность> 2. Можно записать pdf-файл гауссиана ...
вопрос задан: 25 August 2011 11:46
0
ответов

Prilagodite p-vrijednosti za višestruke usporedbe u Matlabu

Imam niz ćelija p-vrijednosti koje se moraju prilagoditi za višestruke usporedbe. Kako to mogu učiniti u Matlabu? Ne mogu pronaći ugrađenu funkciju. U RI bi učinio: data.pValue_adjusted = p.adjust (...
вопрос задан: 25 August 2011 09:23
0
ответов

Определить, является ли набор данных линейной или логарифмической функцией?

У меня есть набор точек данных, и мне любопытно, представляют ли данные линейную функцию или логарифмическую функцию. Набор данных двумерный. Скажем, идеальный набор точек данных следует за ...
вопрос задан: 24 August 2011 21:19
0
ответов

Добавить статистическую информацию в нижнюю часть графика

Я пытаюсь добавить статистическую информацию (мин., Макс., Значения квартилей, среднее, медианное и т. Д.) Относительно данного распределения в нижнюю часть графика. график (гистограмма, график временного ряда) в R. Я знаю, что статистика может быть ...
вопрос задан: 23 August 2011 09:55
0
ответов

Этот генератор паролей смещен? [closed]

Есть ли ошибка в этой команде для генерации паролей? head -c 8 / dev / random | uuencode -m - | sed -n '2s / = * $ //; 2p' После генерации с его помощью нескольких паролей я начал подозревать, что он имеет тенденцию к ...
вопрос задан: 23 August 2011 03:20
0
ответов

весовые данные с R Часть II

Дан следующий фрейм данных: структура (список (UH6401 = c (1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 1, ...
вопрос задан: 17 August 2011 06:51
0
ответов

Контролируемое обучение поведения пользователей с течением времени

Я хочу использовать машинное обучение для определения подписи пользователь, который конвертируется в подписчика в сети сайт, учитывая их поведение с течением времени. Допустим, у моего веб-сайта 6 различных функций, которые могут быть ...
вопрос задан: 10 August 2011 20:48
0
ответов

Алгоритм сглаживания для равномерного показа объявлений в течение месяца

Допустим, у меня есть 10 объявлений, отображается на веб-сайте. Если объявление №1 должно быть показано 100 тыс. В конкретный месяц, как бы вы сделали, чтобы эти объявления отображались равномерно / плавно в течение дня? Я должен взять ...
вопрос задан: 10 August 2011 18:53
0
ответов

Как построить график stacked bar with ggplot?

Я просматривал примеры, представленные на этой странице, но по какой-то причине не мог найти правильный способ сделать это. У меня есть такие данные: Процент участников группы [1,] «1» «A» ...
вопрос задан: 10 August 2011 07:57
0
ответов

Посмотрите, сколько раз было загружено мое бесплатное приложение для iPhone

Есть ли способ узнать, сколько раз было загружено мое приложение для iPhone? Я обнаружил, что на этом форуме вы можете увидеть это в разделе «Продажи» и «Тенденции», но ежедневного отчета найти не удалось. Статистика по ...
вопрос задан: 10 August 2011 06:16
0
ответов

Вычисление функции взаимной корреляции?

В R я использую ccf или acf для вычисления парной функции взаимной корреляции, чтобы я мог выяснить, какой сдвиг дает мне максимальное значение. Судя по всему, R дает мне нормализованную последовательность ...
вопрос задан: 9 August 2011 05:08