3
ответа

Что методы/инструменты там для обнаружения общих фраз в блоках текста?

Позволяет говорят, что у меня 100 000 почтовых тел, и 2000 их содержит abitrary общую строку как "быстрая коричневая лиса, перепрыгивает через лентяя", или "lorem ipsum печаль находятся сережка". Какие методы...
вопрос задан: 15 September 2009 10:55
3
ответа

Что такое Анализ данных Java, JDM?

Я смотрю на JDM. Это - просто API для взаимодействия с другими инструментами, которые делают фактический анализ данных? Или этот ряд пакетов, которые содержат фактические алгоритмы анализа данных?
вопрос задан: 21 July 2009 20:10
3
ответа

Кто-то может объяснить анализ данных, SSIS, BI, ETL и другие связанные технологии?

Я говорил с коллегой вчера относительно ситуации, где он использовал SSIS (или что-то как этот), чтобы сделать немного действительно охлаждают вещь с Пакетом SSIS, куда он передал на имя как "Доктор.
вопрос задан: 6 January 2009 19:05
2
ответа

Программно установить адрес прокси, порт, пользователя, пароль через реестр Windows

I ' Я пишу небольшое приложение на C #, которое будет использовать Internet Explorer для взаимодействия с парой веб-сайтов с помощью WatiN. Однако время от времени также потребуется использовать прокси. Я ...
вопрос задан: 20 August 2018 17:45
2
ответа

Разделение данных в наборы данных обучения/тестирования в MATLAB?

После некоторого исследования я нашел, что две функции в MATLAB сделали задачу: cvpartition функционируют на Панели инструментов Статистики crossvalind функция на Панели инструментов Биоинформатики Теперь, я привык cvpartition для...
вопрос задан: 12 October 2011 22:38
2
ответа

Интерактивный классификатор дерева решений

Кто-либо может рекомендовать реализацию классификатора дерева решений, или в Python или в Java, который может использоваться инкрементно? Все реализации, которые я нашел, требуют, чтобы Вы предоставили все функции...
вопрос задан: 13 July 2010 15:32
2
ответа

Платформы разработки для Финансового моделирования (Что используют Шесты для отталкивания?)

Количественные Аналитики или "Шесты для отталкивания" предсказывают поведение рынков для максимизации прибыли. Я интересуюсь программным обеспечением, которое они используют для выполнения этого. Есть ли платформы разработки, библиотеки...
вопрос задан: 3 June 2010 22:05
2
ответа

'Подобие' в анализе данных

В области Анализа данных, там определенный раздел науки под названием 'Подобие'? Если да, с чем это имеет дело. Любые примеры, ссылки, ссылки будут полезны. Кроме того, будучи в новинку для поля, меня...
вопрос задан: 22 May 2010 09:16
2
ответа

Индексация и поиск по слоям комментариев уровня слова в Lucene

Я имею набор данных с несколькими слоями аннотации по базовому тексту, такими как часть тегов, блоки от поверхностного синтаксического анализатора, называю объекты и других от различной обработки естественного языка (...
вопрос задан: 22 May 2010 06:49
2
ответа

Анализ текста с [закрытым] PHP

Я делаю проект для урока колледжа, который я посещаю. Я использую PHP для создания простого веб-приложения, которые классифицируют твиты как "положительные" (или счастливый) и "отрицательный" (или печальный) на основе ряда словарей...
вопрос задан: 7 May 2010 00:23
2
ответа

Как BI связан с анализом данных?

Я немного смущен о том, как соединить BI с анализом данных. BI можно назвать как некоторое проявление анализа данных? Насколько отличающийся инструмент BI как Microsoft Analysis Services от данных...
вопрос задан: 9 May 2009 23:59
1
ответ

Наивный Байесовский для обнаружения Темы с помощью “Мешок Слов” подход

Я пытаюсь реализовать наивный подход bayseian для нахождения темы данного документа или потока слов. Есть ли существует Наивный Байесовский подход, что я смог искать это? Кроме того, я...
вопрос задан: 10 April 2019 21:03
1
ответ

Как определить, использовать ли алгоритмы машинного обучения или технику интеллектуального анализа данных для заданного сценария?

За последние несколько недель я прочитал очень много статей по машинному обучению и интеллектуальному анализу данных. Статьи, такие как разница между ML и DM, сходства и т. Д. И т. Д. Но у меня все еще есть один вопрос ...
вопрос задан: 24 March 2019 10:34
1
ответ

Я пытаюсь преобразовать столбец str в число с плавающей точкой в ​​фрейме данных, используя Python 2

Я новичок в анализе данных и ищу помощь. Я создаю свой алгоритм Knn с нуля, используя python. Мне нужно преобразовать один из столбцов моего фрейма данных, который является str, в число с плавающей точкой. Я использую python ...
вопрос задан: 19 January 2019 17:52
1
ответ

Какой метод Вы используете для выбора оптимального количества кластеров в k-средствах и EM?

Много алгоритмов для кластеризации доступны. Популярным алгоритмом являются K-средства, где на основе данного количества кластеров алгоритм выполняет итерации для нахождения лучших кластеров для объектов. Какой метод...
вопрос задан: 26 September 2017 12:56
1
ответ

Данные новостей API или подача

Я хотел бы знать, существует ли какая-либо подача/API новостей, которая может использоваться для coding/datamining. Skygrid, например, дает живые ленты новостей и если новости хороши или плохи, но это - все во флэш-памяти, и они надевают'...
вопрос задан: 31 July 2017 12:24
1
ответ

Совместная Фильтрация: Способы определить неявные очки к продуктам для каждого пользователя?

Реализовав алгоритм для рекомендации продуктов с некоторым успехом я теперь смотрю на способы вычислить начальные входные данные для этого алгоритма. Моя цель состоит в том, чтобы вычислить счет к каждому...
вопрос задан: 9 March 2014 00:47
1
ответ

Реализация Наивного Байесового алгоритма в Java - Потребность некоторое руководство

Как Школьное присвоение я обязан реализовывать Наивный Байесов алгоритм, который я намереваюсь сделать в Java. В попытке понять, как ее сделанный, я прочитал книгу "Анализ данных - Практическая Машина...
вопрос задан: 23 September 2012 01:58
1
ответ

Как узнать, является ли предложение вопросом (вопросительным)?

Существует ли библиотека / алгоритм Java с открытым исходным кодом для определения, является ли конкретный фрагмент текста вопросом или нет? Я работаю над системой ответа на вопросы, которая должна анализировать, вводится ли текст с помощью ...
вопрос задан: 9 December 2010 16:04
1
ответ

каково различие между горной промышленностью правила Ассоциации и частой горной промышленностью itemset

я плохо знаком с анализом данных и путаю о правилах Ассоциации и частой горной промышленности объекта. для меня я думаю, что оба - то же, но мне нужны представления от экспертов по этому форуму, Мой вопрос - то, что является различием...
вопрос задан: 16 June 2010 05:43
1
ответ

Обнаружение редкого случая

Там хорошо работает ссылка на Алгоритмы, которые люди используют для обнаружения редкого случая? Кроме того, Как фактор времени принят во внимание? Если у меня есть случай, где последовательные точки данных говорят что-то (...
вопрос задан: 10 June 2010 19:21
1
ответ

Как найти общие фразы в большом теле текста

Я работаю над проектом в данный момент, где я должен выбрать наиболее распространенные фразы в огромном теле текста. Например, скажите, что у нас есть три предложения как следующее: собака, через которую перепрыгивают...
вопрос задан: 18 December 2009 23:32
0
ответов

ОПТИКА Алгоритм кластеризации. Как получить лучший эпсилон

Я реализую проект, который должен сгруппировать географические точки. Алгоритм OPTICS кажется очень хорошим решением. В качестве входных данных требуется всего 2 параметра (MinPts и Epsilon), а именно: ...
вопрос задан: 20 August 2019 19:21
0
ответов

В чем разница между динамическим преобразованием времени и алгоритмом Нидлмана-Вунша?

Я ищу различия между динамическим преобразованием времени и алгоритмом Нидлмана-Вунша. По сути, они оба находят общий балл. Мне нужно вычислить оценку совпадения (сходства) между ...
вопрос задан: 5 August 2019 11:40
0
ответов

В чем разница между матрицей неточностей и таблицей непредвиденных обстоятельств?

Я пишу фрагмент кода для оценки моих Алгоритм кластеризации, и я обнаружил, что для любого метода оценки необходимы базовые данные из матрицы am * n, например A = {aij}, где aij - количество данных ...
вопрос задан: 11 June 2019 11:27
0
ответов

Каково интуитивное объяснение техники максимизации ожидания? [закрыто]

Максимизация ожидания (EM )— это своего рода вероятностный метод классификации данных. Пожалуйста, поправьте меня, если я ошибаюсь, если это не классификатор. Каково интуитивное объяснение этой техники ЭМ?...
вопрос задан: 28 April 2019 18:28
0
ответов

Очистка веб-страницы с помощью C # и HTMLAgility

Я читал, что HTMLAgility 1.4 - отличное решение для очистки веб-страницы. Как новый программист, я надеюсь, что смогу получить какой-то вклад в этот проект. Я делаю это как форму заявки на C #. ...
вопрос задан: 12 April 2019 14:10
0
ответов

Как найти вероятность подпоследовательностей, полученных из последовательностей в данном наборе данных?

У меня есть набор данных (файл CSV) последовательности ссылок с их порядком размещенных статусов для каждой последовательности. Я получил подпоследовательности с их счетом с помощью алгоритма prefixSpan (как описано здесь). ...
вопрос задан: 22 March 2019 12:47
0
ответов

Сравнение R и Matlab для интеллектуального анализа данных

Вместо того, чтобы начать кодировать в Matlab, я недавно начал изучать R, главным образом потому, что это открытый исходный код. В настоящее время я работаю в области интеллектуального анализа данных и машинного обучения. Я нашел много машинного обучения
вопрос задан: 25 February 2019 07:34
0
ответов

Как кластеризовать изображение с помощью DBSCAN и получить вывод через изображение?

Как кластеризовать в соответствии со значениями цвета, например, кластеризовать диапазон значений цвета дороги в одно и дать результат в одном и том же. Я реализовал один, но он сгруппировал все в один цвет. ...
вопрос задан: 18 January 2019 04:32