13
ответов

Сравнение частоты элементов в двух файлах CSV с использованием R [duplicate]

У меня есть два CSV-файла A и B, соответствующие элементы которых состоят из слова и связанной с ним частоты. Оба файла CSV имеют формат: __word__ | _freq | __ blah | 423 | bleh | 554 | ... .....
вопрос задан: 22 March 2017 17:14
12
ответов

Что лучший подход должен распознать шаблоны в данных, и что лучший способ состоит в том, чтобы узнать больше по теме?

Разработчик, с которым я работаю, разрабатывает программу, которая анализирует изображения тротуара для нахождения трещин в тротуаре. Для каждой трещины его программа находит, она производит запись в файле, который говорит мне...
вопрос задан: 23 July 2010 14:36
7
ответов

Получить максимальное значение / дату для строк, имеющих одинаковое значение для столбца в pandas [duplicate]

Это то, что у меня есть (этот пример - упрощенная версия моих исходных данных): data = {'1': [22, 2, '2018-06-01'], '2': [24, 2, '2018- 06-30 '],' 3 ': [28, 5,' 2018-06-22 '],' 4 '...
вопрос задан: 26 March 2017 01:00
7
ответов

как суммировать значения столбца на основе других значений столбцов в pandas [duplicate]

У меня есть dataframe, как это: ID State Qty 1 'UP' 2 1 'UP' 3 1 'AR' 1 2 'KJ' 3 4 'AP' 1 2 'KJ' 4 Вот что мне нужно: я хочу суммировать значения Qty нескольких ...
вопрос задан: 7 October 2016 22:06
7
ответов

Эффективный способ проанализировать большие объемы данных?

Я должен проанализировать десятки тысяч строк данных. Данные импортируются из текстового файла. Каждая строка данных имеет восемь переменных. В настоящее время я использую класс для определения структуры данных. Поскольку я читал...
вопрос задан: 28 February 2010 01:26
6
ответов

Как я могу назначить строки в столбце dataframe, используя python [duplicate]

В моем фрейме данных есть 6 столбцов, а 2 из них имеют строковые значения, я хочу изменить эти строки с уникальными номерами, чтобы моя датафрейма содержала только числа. Я использовал labelEncoder и ...
вопрос задан: 13 February 2017 05:14
6
ответов

AttributeError: модуль 'json' не имеет атрибута 'load' [duplicate]

У меня есть json-пакет в моей системе и также сохранил пакет json.py в том же каталоге, где хранится json-файл. Тем не менее я передаю эту ошибку: AttributeError: модуль 'json' не имеет атрибута 'load'. ...
вопрос задан: 8 December 2013 00:05
5
ответов

Как добавить DataFrame к себе эффективным способом в python? [Дубликат]

Я хочу добавить DF к себе. Есть ли более эффективный способ сделать это, чем то, что я сделал ?: SomeDF # это dataframe df1 = pd.DataFrame.copy (SomeDF) df2 = pd.DataFrame.copy (SomeDF) SomeDF = SomeDF ....
вопрос задан: 27 May 2014 12:09
4
ответа

Как развернуть .py-модели в java-сервер? [Дубликат]

У меня есть db, в котором хранится цена share (давайте возьмем долю MSFT в качестве примера) за любой данный день в прошлом, а затем у меня есть сценарий .py, который может предсказать цену (я должен передать цены на ...
вопрос задан: 28 July 2015 11:03
4
ответа

Как добавить datarow из df в другую верхнюю строку df [duplicate]

У меня два df df1, количество ключей один 2 два 3 df2, количество ключей четыре 5 пять 6 Я попытался добавить, но добавляет в конце, мой желаемый результат должен быть, df, количество ключей один 2 два 3 четыре 5 ...
вопрос задан: 12 October 2012 00:53
4
ответа

Тонкая настройка X-Label в MatPlotLib [дубликат]

Я пытаюсь использовать matplotlib для создания разброса цены собственности по почтовому индексу. Проблема, с которой я сталкиваюсь, заключается в том, что он не будет показывать почтовый индекс внизу. Это дает в аннотированных научных ...
вопрос задан: 26 September 2011 19:03
4
ответа

Как я реализую реальное время *финансовый* механизм статистики от данных SQL-сервера для дисплея панели инструментов?

Мы в настоящее время используем автоматизацию Excel, чтобы вычислить статистику временного ряда и сохранить результаты в нашей базе данных SQL Server 2008 для легкого дисплея/сортировки/и т.д. позже. Я в настоящее время перепроектирую дом...
вопрос задан: 24 June 2009 00:56
3
ответа

В Jupyter Notebooks мой самый левый столбец не читается как столбец, когда я пытаюсь работать с ним, как это исправить? [Дубликат]

У меня был кадр данных о данных о недвижимости, который я отфильтровал и создал этот новый фрейм данных, с помощью groupby, чтобы получить разбивку процентилей и количество домов для продажи в каждом районе ...
вопрос задан: 7 November 2015 11:19
3
ответа

Получение содержания библиотеки в интерактивном режиме в R

Существует ли эквивалент функции dir (Python) в R? Когда я загружаю библиотеку в R как - библиотека (vrtest), я хочу знать все функции, которые находятся в той библиотеке. В Python dir (vrtest) был бы...
вопрос задан: 27 November 2009 16:07
2
ответа

Как отличить шифрование от сжатия в реальном времени

Я работаю над фильтром сетевого трафика, и мне нужно классифицировать входной IP-трафик на 3 группы: Зашифрованный трафик Сжатый трафик Ни зашифрованный, ни сжатый трафик Сжатые и зашифрованные данные ...
вопрос задан: 13 July 2018 07:22
2
ответа

Рабочий процесс для разработки приложений перемалывания чисел на амазонке ec2/S3

Много было записано о развертывающихся приложениях уплотнения данных на EC2/S3, но я хотел бы знать, каков типичный рабочий процесс для разработки таких приложений? Позволяет говорят, что у меня есть 1 ТБ времени...
вопрос задан: 19 February 2010 17:11
2
ответа

Как Вы имеете дело с недостающими данными с помощью numpy/scipy?

Одной из вещей, я имею дело с большинством в очистке данных, являются отсутствующие значения. R имеет дело с этим хорошо использование его "NA" недостающая маркировка данных. В Python кажется, что я должен буду иметь дело с массивами маскированн
вопрос задан: 5 September 2009 09:36
1
ответ

Matplotlib: Форматирование дат на оси X в 3D Гистограмме

Учитывая этот 3D пример кода гистограммы, как Вы преобразовали бы числовые данные в оси X к отформатированной дате / строки времени? Я делал попытку использования топора xaxis_date () функция без успеха. Я также...
вопрос задан: 12 June 2019 16:05
1
ответ

Определить поведение пазухи в потоке данных

Я хочу определить, когда значения данных упорядочены как синусоидальная форма. Например, на картинке. До сих пор я работал с данными, такими как STD, RMS и т. Д., Над данными для идентификации сигналов. Сейчас я ...
вопрос задан: 14 April 2019 09:13
1
ответ

Не удается получить наборы данных в PyTables с использованием естественного именования

Я новичок в PyTables, и я хочу получить набор данных из HDF5 с использованием естественного именования, но я получаю эту ошибку, используя этот ввод: f = tables.open_file ("filename.h5", "r") f.root. группы 1.dataset-1 ....
вопрос задан: 17 March 2019 20:33
1
ответ

Проблема двойного цикла с изменением данных в Python

У меня есть 100 строк входных данных, и, как вы можете видеть, я пытаюсь изменить значение входных данных с помощью цикла for. Следовательно, моя модель рассчитывает 100 * 6 раз. Кроме того, я хочу увидеть минимальное значение ...
вопрос задан: 3 March 2019 21:27
1
ответ

Необходимость коррекции бонферрони в А / Б тестировании?

Я новичок в области науки о данных. Я наткнулся на следующие утверждения, которые гласят: 1) Чем больше метрик мы выберем в нашем A / B-тестировании, тем выше вероятность случайного получения значительной разницы. ...
вопрос задан: 2 March 2019 09:58
1
ответ

Правильно ли я сделал этот вопрос о нормализации базы данных?

Я изучаю нормализацию базы данных, получил вопрос, но не знаю, правильно ли я это сделал или нет. Вот мое решение:
вопрос задан: 19 January 2019 12:54
1
ответ

python: разбивка по возрастной группе по среднему количеству друзей

у меня есть датафрейм с 4 атрибутами, это можно увидеть удар. то, что я хотел сделать, это взять имя и возраст человека и посчитать количество друзей, которые у него есть. тогда из двух человек имеют одинаковый возраст ...
вопрос задан: 16 January 2019 16:17
1
ответ

исследования с множественной переменной (2d) в пандах

Dears, у меня есть проект от Udacity «Аналитик данных Nanodegree», в этом проекте я должен анализировать и исследовать данные IMDB, чтобы ответить на множество вопросов, которые были решены мной. кажется, все ...
вопрос задан: 13 July 2018 08:58
1
ответ

Как я могу добраться (x, y) значения графика, который построен контурным графиком?

Есть ли простой способ добраться (x, y) значения линии контура, которая была напечатана как это: импортируйте matplotlib.pyplot как plt x = [1,2,3,4] y = [1,2,3,4] m = [[15,14,13,12], [14,12,10,8], [13,10,7,4], [12...
вопрос задан: 3 September 2017 16:46
0
ответов

Нахождение локальных экстремумов в спектре

Я пытаюсь написать код Python, который может очень точно определить положение интерференционных пиков в ИК-спектре. Код работает для некоторых файлов данных, но для других спектров, он находит для многих ...
вопрос задан: 7 April 2019 12:32
0
ответов

Разделение или проверка значений в одном столбце [дубликаты]

Мне нужна помощь для анализа моих данных. Давайте посмотрим на часть моих данных: ответы студентов 1 ABCCDAECCA 2 ABCBBAECCA 3 ABCEEAECCA 4 ABCCCAECCA 5 ...
вопрос задан: 19 March 2019 03:17
0
ответов

Использование строк в качестве аргументов в UDF в R

Я значительно продвинулся в изучении R и чувствую себя достаточно комфортно с окружающей средой. Я обнаружил, что R является языком интерпретатора, а не языком компилятора, таким как VBA, ...
вопрос задан: 3 March 2019 10:54
0
ответов

Точность преобразования красного смещения расстояния AstroPy

Насколько точна конверсия красного смещения функции AstroPy.coordinates.Distance? Это представляется полезным только для тысячных цифр (гораздо менее точных, чем вопросы точности чисел с плавающей запятой): ...
вопрос задан: 28 February 2019 23:18