У меня есть столбец в кадре данных, который имеет неравномерные данные. У меня в общей сложности 150 000 записей. Например, COLUMN xxx xxx yyy xxx yyy zzz xxx yyy zzz aaa Я хотел бы взять столбец выше ...
Друг отправил меня вдоль этого большого учебного руководства на webscraping NYtimes с R. Я действительно любил бы пробовать его. Однако первый шаг является к установленному пакетом под названием RJSONIO из источника. Я знаю R...
Если у меня есть некоторый список R mylist, можно добавить объект obj к нему как так: mylist [[длина (mylist) +1]] <-obj, Но конечно существует некоторый более компактный путь. Когда я был новым в R, я пытался писать lappend (...
Я строю алгоритм классификации для проекта текстовой аналитики. Кажется, все хорошо, когда я строю модели, но когда я использую функцию прогнозирования, я получаю эту ошибку, которую я не понимаю. Ниже мой ...
У меня есть кадр данных с некоторыми числовыми переменными и некоторыми категориальными факторными переменными. Порядок уровней для тех факторов не является способом, которым я хочу, чтобы они были. числа <-1:4 буквы <-фактор (...
Я только что закончил читать об обзоре во введении R и очень любопытен на предмет <<-присвоение. Руководство показало один (очень интересный) пример для <<-, который я чувствую, что понял...
Я хотел бы использовать кластеризацию корреляции и меня, рисунок R является хорошим местом для запуска. Я могу представить данные R как ряд больших, редких векторов или как таблица с предварительно вычисленной матрицей несходства...
У меня есть GNU R установленный (подобный S пакет статистики; версия 2.8.1) и PostgreSQL (8.4.1), но я не могу подключить GNU R к моему RDBMS. Когда я сначала сделал это (несколько лет назад - потерянный код), DBI для R не сделал...
У меня есть код, который работает при обновлении, но я хотел бы изменить обработку событий, когда происходит 1 из 2 событий, а не когда происходят оба события. Прямо сейчас пользователь должен обновить оба ...
У меня есть dataframe: test & lt; - data.frame (seq (as.POSIXct ("12-31-1999 12:15:00", format = "% m-% d-% Y% H:% M:% S "), as.POSIXct (" 12-31-2000 12:15:00 ", format ="% m-% d-% Y% H:% M:% S "), на =" 15 минут ") ) ...
Может ли кто-нибудь рассказать мне, как я могу объединить два набора данных на основе строковой переменной? Коды, подобные «matchit», мне не полезны, потому что они требуют идентификатора или индекса в качестве ссылки, но у меня нет ...
Эта проблема заключается в написании регулярного выражения для редактирования столбца отраслевых имен, которые у меня есть в фрейме данных. Чтобы создать примерный кадр данных, здесь приведен код: Industries & lt; -c («ОТДЫХ - Рестораны», «...
Я узнал, что по моим исходным данным у меня есть поля, которые постоянно следуют за потреблением гранул. Однако, когда число заканчивалось на 0, нуль был опущен, и поэтому я хотел бы ...
Я новичок в r и просто пытаюсь использовать мудрую функцию. Но, похоже, это не дало мне то, что я хотел. df1 & lt; - data.frame (Y1 = c (1, 2, 3, 4, 5), Y2 = c (1, 3, 4, 2, 6), ...
У меня есть несколько больших CSV, для которых мне нужно знать количество записей, содержащихся в каждом. Я знаю, что могу сделать это, загрузив данные в R и используя nrow (), но это займет довольно много времени для всех ...
Предположим, у меня есть столбец возрастов. Есть ли функция, которую я могу использовать для создания возрастной группы? Например, моя возрастная полоса 20-34 35-49 50-64 65-79 80+ 20-34 35-49 50-64 65-79 80+ Что у меня есть & gt; Икс [...
Для кадра данных first = c (5,11,111,1111,564,877) second = c (1,1,2,2,3,3) sample & lt; - data.frame (first, second) first second 1 5 1 2 11 1 3 111 2 4 1111 2 5 ...
У меня ужасное время, пытаясь понять это. Пробовал кучу методов / функций, и до сих пор ничто не работает для меня и трудно понять, почему нет ... У меня есть данные ...
У меня есть четырехъядерный ноутбук, выполняющий Windows XP, но смотрящий на Диспетчер задач R только когда-либо, кажется, использует один процессор за один раз. Как я могу заставить R использовать все четыре процессора и ускорить мои программы R?
У меня есть фрейм данных с некоторыми значениями NA. Мне нужна сумма двух столбцов. Если значение равно NA, мне нужно рассматривать его как ноль. a b c d 1 2 3 4 5 NA 7 8 Столбец e должен быть суммой b и c: e 5 7 ...
Есть ли какие-либо пакеты R для вычисления tau-b и tau-c Kendall и их связанных стандартных погрешностей? Мои поиски на Google и Rseek ничего не подняли, но конечно кто-то имеет...
У меня есть несколько наборы данных с 75 000 наблюдений и переменной типа, которая может взять значение 0-4. Я хочу добавить пять новых фиктивных переменных к каждому набору данных для всех типов. Лучшим способом я мог приехать...
Я получил большой R-скрипт от друга и модифицирую его. Сценарий вызывает множество пакетов в игру, но я знаю, что не все из них используются в тексте сценария. Есть ли ...
Я заметил, что функции R могут включать переменные, которые не заданы в качестве аргументов. Например: foo & lt; - "hello world" bar & lt; - 10 test.fun & lt; - function () {print (foo)} test.fun () [1] "hello ...
У меня много файлов .xml в 1 папке, и мне нужно объединить все эти файлы в 1 CSV-файл. Мне нужно пройти каждый файл, используя list.files один за другим, выполнить мои вычисления и распечатать результат ...
У меня есть data.frame с около 2000 столбцов. Как добавить сумму некоторого подмножества из них в файл data.frame с помощью оператора% & gt;%? Библиотека библиотеки примеров экземпляров (dplyr) (magrittr) set.seed (18) X & lt; -rnorm (...