12
ответов

Инструменты открытого исходного кода Анализа данных [закрываются]

Я должен поднять проект, который является в анализ данных. Прежде чем я вскочу, я хотел зондировать вокруг для различных инструментов анализа данных (предпочтительно открытый исходный код), который позволяет веб-создание отчетов. В моем...
вопрос задан: 31 May 2011 13:20
9
ответов

Лучшая база данных DataMining

Я - случайный программист Python, кто только работал до сих пор с базами данных MYSQL или SQLITE. Я - компьютерный человек для всего в небольшой компании, и я был запущен новый проект где я...
вопрос задан: 6 April 2010 19:06
8
ответов

сглаживание нерегулярно выбранных данных времени

Учитывая таблицу, где первый столбец является секундами мимо определенной контрольной точки и второй, произвольное измерение: 6 0.738158581 21 0.801697222 39 1.797224596 49 2.77920469 54 2....
вопрос задан: 22 June 2009 12:21
7
ответов

Какие инструменты анализа данных Вы используете? [закрытый]

Помимо двух известных инструментов Open Source RapidMiner и Weka, там какие-либо другие хорошие инструменты (или Открытый исходный код или Коммерческий), который можно рекомендовать для анализа данных?Заранее спасибо!
вопрос задан: 15 September 2010 18:13
7
ответов

алгоритмы для оценки пользовательских ответов

Я работаю над веб-приложением, которое будет использоваться для классификации фотографий автомобилей. Пользователям подарят фотографии различных механизмов и попросят ответить на серию...
вопрос задан: 1 November 2009 21:28
7
ответов

Альтернативы программного обеспечения с открытым исходным кодом Datamining [закрываются]

Я оцениваю datamining пакеты. Я имею, находят эти два до сих пор: RapidMiner Weka у Вас есть опыт совместно использовать с этими двумя продуктами или каким-либо другим продуктом, чтобы рекомендовать мне? Спасибо
вопрос задан: 28 October 2008 12:03
6
ответов

Что означает сокращение размерности?

Что сокращение размерности означает точно? Я искал его значение, я просто нашел, что это означает преобразование необработанных данных в более полезную форму. Таким образом, каково преимущество наличия данных...
вопрос задан: 3 January 2018 11:48
6
ответов

Как работает функция рекомендаций Amazon?

Какая технология скрывается за рекомендациями Amazon? Я считаю, что рекомендации Amazon в настоящее время являются лучшими на рынке, но как они предоставляют нам такие актуальные ...
вопрос задан: 20 May 2013 11:44
6
ответов

Способы вычислить подобие

Я делаю общественный веб-сайт, который требует, чтобы я вычислил подобие между любыми двумя пользователями. Каждый пользователь описан со следующими атрибутами: возраст, тип кожи (масляный, сухой), тип волос (долго...
вопрос задан: 27 September 2011 01:59
6
ответов

Монитор выпускается под брендом с общими словами

Скажем, необходимо контролировать бренд "ONE" онлайн. Какие алгоритмы могут использоваться для разделения страниц о бренде ОДИН от страниц, содержащих общее слово ОДИН? Я думаю, возможно, что Bayes мог работать...
вопрос задан: 15 February 2010 13:08
6
ответов

Анализ шумных данных

Я недавно запустил ракету с барометрическим высотомером, который является с точностью до примерно 10 футов (вычислен через данные, полученные во время полета). Зарегистрированные данные находятся в инкрементах времени 0,05 секунд на образец...
вопрос задан: 24 December 2009 05:28
6
ответов

Что такое анализ данных с точки зрения разработчика?

Я могу найти техническое объяснение того, какой анализ данных находится в книге или на Википедию, но я задаюсь вопросом, какую разработку это точно включает? Это больше об использовании инструментов или больше о...
вопрос задан: 14 July 2009 08:00
5
ответов

Какие задания искусственного интеллекта там? [закрытый]

В течение моих учебных лет в информатике я влюбился во многие аспекты искусственного интеллекта. От экспертных систем, нейронных сетей, к анализу данных (классификация). Интересно, если я был...
вопрос задан: 5 May 2012 14:22
5
ответов

Проблема машинного обучения: диагностируя программу в Java / отличный (datamining, машинное обучение)

Я планирую разработать программу в Java, который предоставит диагноз. Набор данных разделен на две части один для обучения и другого для тестирования. Моя программа должна учиться классифицировать от...
вопрос задан: 22 May 2010 23:35
5
ответов

Как сохранить ценность многих лет временного ряда 100 x 25 Гц - SQL-сервер или timeseries база данных

Я пытаюсь определить возможные методы для хранения 100 каналов данных с плавающей запятой на 25 Гц. Это приведет к 78 840 000 000 точкам данных в год. Идеально все эти данные были бы эффективно...
вопрос задан: 10 June 2009 16:36
4
ответа

Какой алгоритм анализа данных Вы предложили бы для этого конкретного сценария?

Это не связанный вопрос непосредственно программирования, но это о выборе правильного алгоритма анализа данных. Я хочу вывести возраст людей от их имен от региона, они живут...
вопрос задан: 1 March 2010 16:39
4
ответа

Нахождение центра кластера

У меня есть следующая проблема - сделанный кратким обзором для вывода наружу ключевых вопросов. У меня есть 10 точек каждый, который является некоторым расстоянием от другого. Я хочу смочь найти центр кластера т.е...
вопрос задан: 10 August 2009 09:04
4
ответа

Кластеризация Алгоритма с дискретными и непрерывными атрибутами?

Кто-либо знает, что хороший алгоритм для выполняет кластеризацию и на дискретных и на непрерывных атрибутах? Я работаю над проблемой идентификации группы подобных клиентов, и у каждого клиента есть оба...
вопрос задан: 6 May 2009 13:45
3
ответа

Учебные руководства WEKA / Примеры для [закрытого] Новичка

В продолжении этого ответа я хочу спросить, знает ли какой-либо из Вас пользу (и что еще более важно легкий понять) учебные руководства и / или примеры анализа данных с инструментарием Weka. Я был очень...
вопрос задан: 18 June 2019 07:06
3
ответа

Лучше всего кластеризируя алгоритм? (просто объясненный)

Вообразите следующую проблему: у Вас есть база данных, содержащая приблизительно 20 000 текстов в таблице, названной "статьями", Вы хотите соединить связанные с помощью кластеризирующегося алгоритма для отображения...
вопрос задан: 19 May 2017 13:19
3
ответа

Получение финансовых данных из Google Finance, который выходит за рамки API

Финансы Google API являются неполными - многие числа на странице, такие как: http://www.google.com/finance?fstype=ii&q=NYSE:GE не доступен через API. Мне нужны эти данные для рейтинга...
вопрос задан: 20 March 2016 17:10
3
ответа

Получение данных о плотности населения

Мне нужно выяснить, считается ли данное место городским или сельским. Я полагаю, что лучший способ сделать это - посмотреть на плотность населения города / штата или провинции / страны ...
вопрос задан: 18 January 2016 13:52
3
ответа

Кто-то может дать пример подобия косинуса очень простым, графическим способом?

Статья Cosine Similarity о Википедии, можно ли показать векторы здесь (в списке или чем-то) и затем сделать ли математику и позволить ли нам видеть, как это работает? Я - новичок.
вопрос задан: 6 October 2015 01:08
3
ответа

R случайная лесная важность переменной

Я пытаюсь использовать случайный лесной пакет для классификации в R. Переменные перечисленные Меры по Важности: подразумевайте, что необработанный счет важности переменной x для класса 0 означает необработанный счет важности...
вопрос задан: 28 August 2012 13:45
3
ответа

Новички Hadoop [закрываются]

Я пытаюсь практиковать некоторые алгоритмы анализа данных с помощью hadoop. Я могу сделать это с одним только HDFS, или я должен использовать подпроекты как hive/hbase/pig?
вопрос задан: 11 January 2012 15:56
3
ответа

Вероятностное поколение семантических сетей

Я изучил некоторые простые реализации семантической сети и основные методы для парсинга естественного языка. Однако я не видел много проектов, которые пытаются устранить разрыв между двумя. Для...
вопрос задан: 9 July 2010 09:47
3
ответа

Архитектура для аналитики базы данных

У нас есть архитектура, где мы предоставляем каждому клиенту подобные бизнес-аналитике услуги для их веб-сайта (интернет-продавец). Теперь, я должен проанализировать те данные внутренне (для алгоритмического...
вопрос задан: 21 April 2010 06:52
3
ответа

Сравнение алгоритмов анализа данных [закрывается]

Есть ли какие-либо сравнения алгоритмов анализа данных? Сравнения с точки зрения производительности, точности и необходимого объема данных для генерации устойчивой модели. Это кажется тем приобретением знаний ансамблем...
вопрос задан: 6 February 2010 20:08
3
ответа

платформа Java для распознавания образов изображения?

Я ищу платформу Java для помощи с некоторым анализом данных, характерным для изображений. У нас есть ряд исторических изображений, которые я хотел бы категоризировать и классифицировать. Я, надеялся найти что-то...
вопрос задан: 14 January 2010 06:45
3
ответа

Как я извлекаю ключевые слова, используемые в тексте? [закрытый]

Как делают меня, данные взрывают груду текста для получения ключевых слов использованием? ("Jacob Smith" или "забор"), И там программное обеспечение уже, чтобы сделать это? даже полуавтоматически, и если это может отфильтровать простые
вопрос задан: 15 October 2009 21:37