0
ответов

Как получить имя кадра данных в списке?

Как получить имя кадра данных из списка? Конечно, get () получает сам объект, но я хочу, чтобы его имя использовалось в другой функции. Вот пример использования, если вы предпочитаете ...
вопрос задан: 9 October 2015 04:06
0
ответов

Как объединить два фрейма данных на общие столбцы в R с суммой других?

R Версия 2.11.1 32-битная в Windows 7 Я получил два набора данных: data_A и data_B: data_A USER_A USER_B ACTION 1 11 0,3 1 13 0,25 1 16 0,63 1 17 0,26 2 11 0 ....
вопрос задан: 21 September 2015 03:39
0
ответов

Соединение агрегированных значений обратно с исходным фреймом данных [дубликат]

Один из шаблонов проектирования, который я использую снова и снова, - это выполнение «группировать по» или «разбивать, применять, комбинировать» (SAC) "во фрейме данных, а затем снова объединить агрегированные данные с исходными. Это ...
вопрос задан: 20 February 2015 11:58
0
ответов

Как ddply () без сортировки?

Я использую следующий код для суммирования моих данных, сгруппированных со соединением, реплицированием и массой. Сумма. (Соединение, репликация, масса), .fun = ...
вопрос задан: 23 September 2014 16:05
0
ответов

Android HTTP вопросы о входе в систему

Привет, ребята, у меня есть несколько вопросов о реализации функции входа в систему в Android. Есть ли у Android что-нибудь вроде сессий или файлов cookie? Как мне «запомнить», что пользователь вошел в систему? Очевидно, я ...
вопрос задан: 26 June 2014 08:02
0
ответов

ddply + summate для повторения одной и той же статистической функции в большом количестве столбцов

Хорошо, второй вопрос R в быстрой последовательности. Мои данные: Временная метка St_01 St_02... 1 08.02.2008 00:00:00 26.020 25.840 ... 2 08-02-2008 00:10:00 25.985 25.790 ... 3 08-02-2008, 00:20:00 ...
вопрос задан: 31 March 2014 22:42
0
ответов

na.locf преобразует данные из числовых в символьные

сводка (DF)> fx_code date fx_spot fx_fwd implied_fx_vol AUD: 171 мин. : 2000-01-31 мин. : 0,394 мин. : -320.000 мин. : 1.000 ...
вопрос задан: 31 March 2014 20:12
0
ответов

Использование дат с пакетом data.table

Недавно я обнаружил пакет data.table и теперь задавался вопросом, следует ли мне заменить часть моего plyr-кода. Подводя итог, мне очень нравится plyr, и я в основном добился всего, чего хотел. ...
вопрос задан: 23 January 2014 18:03
0
ответов

Как я могу использовать имена переменных для ссылки на столбцы фрейма данных с помощью ddply?

Я пытаюсь написать функцию, которая принимает в качестве аргументов имя фрейма данных, содержащего данные временного ряда, и имя столбца в этом фрейм данных. Функция выполняет различные манипуляции с ...
вопрос задан: 28 November 2013 08:11
0
ответов

Циклы R: добавление столбца в таблицу, если он еще не существует

Я пытаюсь скомпилировать данные из нескольких файлов, используя циклы for в R. Я хотел бы собрать все данные в одну таблицу. Следующий расчет - это просто пример. library (reshape) dat1 <- data.frame (...
вопрос задан: 6 September 2013 17:36
0
ответов

быстрый / элегантный способ построения сводной таблицы среднего / дисперсии

Я могу выполнить эту задачу, но мне кажется, что должен быть «лучший» (самый простой, самый компактный, самый ясный код, самый быстрый?) Способ решения это и пока не понял ... Для указанного набора ...
вопрос задан: 28 August 2013 17:35
0
ответов

R: ускорение операций «группировки по»

У меня есть симуляция, которая имеет большой агрегат и шаг комбинирования прямо посередине. Я прототипировал этот процесс, используя функцию plyr ddply (), которая отлично подходит для огромного процента моих потребностей. Но я ...
вопрос задан: 19 April 2013 09:24
0
ответов

Идиоматический код R для разбиения вектора по индексу и выполнения операции над этим разбиением

Я пытаюсь найти идиоматический способ в R разбить числовой вектор по некоторому индексному вектору, найти сумму всех чисел в этом разделе, а затем разделить каждую отдельную запись на этот раздел...
вопрос задан: 30 March 2013 15:38
0
ответов

более быстрый способ создать переменную, которая агрегирует столбец по id [duplicate]

Есть ли более быстрый способ сделать это? Я полагаю, что это излишне медленно и что подобную задачу можно решить с помощью базовых функций. df <- ddply(df, "id", function(x) cbind(x, perc.total = sum(x$...
вопрос задан: 28 March 2013 09:03
0
ответов

Генерация индикаторов в больших фреймах данных

Цель состоит в том, чтобы создать индикаторы для факторной/строковой переменной во фрейме данных. Этот фрейм данных имеет строки > 2 мм, и при запуске R в Windows у меня нет возможности использовать plyr с .parallel=T. Итак...
вопрос задан: 28 March 2013 08:55
0
ответов

Эффективное нахождение групповых постоянных столбцов в data.frame

Как я могу эффективно извлечь групповые постоянные столбцы из data frame? Я включил реализацию plyr ниже, чтобы уточнить, что я пытаюсь сделать, но это медленно. Как я могу сделать это как ...
вопрос задан: 28 March 2013 00:48
0
ответов

Аналог 'ave' в plyr?

Функция ave() в R гораздо полезнее, чем можно предположить из ее названия - по сути, это версия tapply(), позволяющая вернуть вектор той же длины, что и входные данные, и поместить эти значения обратно в ...
вопрос задан: 28 March 2013 00:46
0
ответов

Элегантный способ решить задачу ddply с помощью агрегата (в надежде на лучшую производительность)

Я хотел бы агрегировать data.frame с помощью переменной идентификатора Ensg. Фрейм данных выглядит следующим образом: набор проб хромосомы ensg symbol XXA_00 XXA_36 XXB_00 1 ...
вопрос задан: 28 March 2013 00:27
0
ответов

R Plyr - Упорядочивание результатов из DDPLY?

Кто-нибудь знает простой способ упорядочить результаты операции ddply summarize? Это то, что я делаю, чтобы получить результат, упорядоченный по убыванию глубины. ddims <- ddply (diamonds,. (...
вопрос задан: 27 March 2013 12:21
0
ответов

Значение ошибки ddply: атрибут 'names' [9] должен иметь ту же длину, что и вектор [1]

Я прохожу через машинное обучение для хакеров, и я застрял в этой строке: from.weight < - ddply (priority.train,. (From.EMail), суммировать, Freq = length (Subject)), который генерирует следующее ...
вопрос задан: 5 January 2013 12:30
0
ответов

Самый быстрый поворот в ширину в R

Я имею дело с простой таблицей значений переменной даты формы 1970-01-01 В1 0,434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970 -...
вопрос задан: 16 October 2012 23:27
0
ответов

изменение формы данных (более быстрый способ)

Наткнулся на таблицу частот. сегодня мне пришлось расшириться до фрейма данных необработанных значений. Я смог это сделать, но мне было интересно, есть ли более быстрый способ использования пакета reshape или data.table? ...
вопрос задан: 5 October 2012 09:07
0
ответов

Проблемы с преобразованием длинного списка data.frames (~1 миллион) в один data.frame с использованием do.call и ldply

Я знаю, что здесь в SO много вопросов о способах преобразования списка data.frames в одиночный data.frame с использованием do.call или ldply, но эти вопросы касаются понимания внутренней работы ...
вопрос задан: 6 September 2012 12:40
0
ответов

Суммирование строк на основе определенных комбинаций факторов

Возможно, это глупый вопрос, но я прочитал главу Кроули о кадрах данных и прошерстил Интернет, но пока не смог сделать что-нибудь работает. Вот пример набора данных, похожий на...
вопрос задан: 2 September 2012 23:54
0
ответов

Как заполнить NA медианой?

Пример данных :начальное значение (1 )df < -data.frame (years=sort (rep (2005 :2010, 12 )), month=1 :12, value=c (rnorm (60 ),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA ))головка (df )...
вопрос задан: 16 August 2012 08:33
0
ответов

Итерация в R для проверки орфографии вектора слов

У меня есть набор данных, полный предложений с неподходящим интервалом. Я пытаюсь придумать способ удалить некоторые пробелы. Я начинаю с предложения, которое я преобразовываю во фрейм данных из слов :и...
вопрос задан: 13 August 2012 19:48
0
ответов

Почему plyr такой медленный?

Я думаю, что неправильно использую plyr. Может ли кто-нибудь сказать мне, является ли это «эффективным» кодом plyr? требуется (плир )plyr < -функция (dd )ddply (dd,. (цена ), итог, сс=сумма (объем ))Немного...
вопрос задан: 8 August 2012 22:44
0
ответов

Как я могу наложить два плотных графика рассеяния, чтобы я мог видеть контуры каждого в R или Matlab?

См. этот пример Это было создано в Matlab путем независимого создания двух точечных диаграмм, создания изображений каждой, затем использования imagesc для их рисования в одну фигуру, а затем, наконец, установки ...
вопрос задан: 7 August 2012 17:42
0
ответов

Произвольная выборка подмножеств переменной кадра данных

Я работаю над большим набором данных, который включает данные о поведении в поездках за недельный период. В течение недели люди заполняли журнал отдельных поездок, которые они совершили ...
вопрос задан: 7 August 2012 17:39
0
ответов

R :Общее сведение JSON к data.frame

Этот вопрос касается общего механизма для преобразования любого набора не-циклических однородных или разнородных структур данных в кадр данных. Это может быть особенно полезно при работе с...
вопрос задан: 19 July 2012 03:39