data-mining - список вопросов по программированию data-mining

0

ответов

Разница между классификацией и кластеризацией в интеллектуальном анализе данных? [закрыто]

Может кто-нибудь объяснить, в чем разница между классификацией и кластеризацией в интеллектуальном анализе данных? Если можете, приведите примеры того и другого, чтобы понять основную идею.

вопрос задан: 23 July 2018 22:34

0

ответов

Полезные функции, используемые в сентиментальном анализе

Я работаю над проектом «Анализ текста», а именно «Сентиментальное обнаружение». Я новичок в этом вопросе, поэтому я хотел бы спросить вас, какие самые важные, необходимые и полезные функции используются для чистых ...

python bigdata data-mining data-analysis text-analysis

вопрос задан: 13 July 2018 20:39

0

ответов

Как дерево решений вычисляет атрибут разделения?

Когда мы используем какой-либо алгоритм дерева решений и наши данные набор состоит из числовых значений. Я обнаружил, что результаты, предоставляемые программой, разбивают узел на значения, которые даже не существуют в ...

machine-learning data-mining decision-tree

вопрос задан: 27 June 2018 16:31

0

ответов

Как подойти к алгоритму игры в угадывание чисел (с изюминкой)?

Я изучаю программирование (Python и алгоритмы) и пытался работать над проектом, который мне показался интересным. Я создал несколько базовых скриптов Python, но я не уверен, как подойти к решению ...

java python algorithm machine-learning data-mining

вопрос задан: 29 April 2018 07:24

0

ответов

Почему одно горячее кодирование улучшает производительность машинного обучения?

Я заметил, что когда кодирование One Hot используется для определенного набора данных (матрицы) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении ...

machine-learning data-mining scikit-learn data-analysis

вопрос задан: 20 October 2017 11:45

0

ответов

Является ли DLIB хорошей библиотекой с открытым исходным кодом для разработки моих собственных алгоритмов машинного обучения на C ++?

Является ли DLIB хорошей библиотекой с открытым исходным кодом для разработки моих собственных алгоритмов машинного обучения на C ++? Как насчет других, таких как libSVM, SHOGUN?

c++ machine-learning data-mining dlib

вопрос задан: 12 June 2017 05:27

0

ответов

Поддержка Java для PMML

Я новичок в PMML: Predictive Masmy Markup Language (www.dmg.org), и мне было интересно, если есть какая-то поддержка Java ( Открытый источник / профессионал) для создания / анализа файлов PMML. Первоначально я ...

java xml data-mining prediction pmml

вопрос задан: 23 May 2017 12:29

0

ответов

Автоопределение CSV в Java

Каким будет надежный способ автоопределения того, что файл действительно является CSV, если CSV будет переопределен как "Character-Separated Values", т.е. данные, использующие любой отдельный символ (но обычно любой не...

java csv data-mining autodiscovery

вопрос задан: 23 May 2017 12:06

0

ответов

Объединение концептуально похожих документов вместе?

Это скорее концептуальный вопрос, чем реальная реализация, и я надеюсь, что кто-то сможет прояснить это. Моя цель заключается в следующем: учитывая набор документов, я хочу сгруппировать их таким образом, чтобы документы ...

python numpy nlp machine-learning data-mining

вопрос задан: 23 May 2017 12:01

0

ответов

Wat sinn e puer gutt Weeër fir "ongeféier" semantesch Ähnlechkeet tëscht Sätz ze schätzen?

Ech hunn den nlp Tag op SO fir déi lescht Stonne gekuckt an sinn zouversiichtlech datt ech näischt verpasst hunn awer wann ech gelift, weist mir weg op d'Fro. An der Tëschenzäit awer, wäert ech ...

python nlp machine-learning data-mining nltk

вопрос задан: 23 May 2017 11:46

0

ответов

Выбор функций и обучение без учителя для многоязычных данных + выбор алгоритма машинного обучения

Вопросы Я хочу классифицировать / категоризировать / кластеризовать / сгруппировать набор из нескольких тысяч веб-сайтов. Есть данные, на которых мы можем обучаться, поэтому мы можем проводить контролируемое обучение, но это не данные, которые мы ...

artificial-intelligence nlp machine-learning data-mining classification

вопрос задан: 23 May 2017 10:33

0

ответов

Кластеризация массива одномерных чисел [дубликат]

Возможный дубликат :Кластеризация одномерных данных -оптимально? Допустим, у меня есть такой массив :[1,1,2,3,10,11,13,67,71] Есть ли удобный способ разбить массив на что-то вроде...

arrays cluster-analysis data-mining dimension partition-problem

вопрос задан: 23 May 2017 10:31

0

ответов

Обнаружение «шаблонов» в данном тексте?

Если у меня есть значительный объем текста и я пытаюсь обнаружить наиболее часто встречающиеся шаблоны, я думал решить эту проблему с помощью N- Подход по Грамму, и на самом деле он был предложен в качестве решения ...

language-agnostic nlp machine-learning data-mining nltk

вопрос задан: 23 May 2017 10:27

0

ответов

msysgit: предупреждение о шрифте Unicode

Недавно я получаю эту ошибку при использовании msysgit, в частности, когда есть некоторый не-ASCII-контент, сгенерированный git вывод: предупреждение: ваш консольный шрифт, вероятно, не поддерживает Unicode. Если ...

java data-mining

вопрос задан: 30 April 2017 13:03

0

ответов

кластеризация и matlab

Я пытаюсь сгруппировать некоторые данные, которые у меня есть из набора данных чашки KDD 1999, выходные данные файла выглядят следующим образом: 0, tcp, http, SF, 239,486,0,0,0, 0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0 ....

matlab machine-learning cluster-analysis data-mining fuzzy

вопрос задан: 27 January 2017 22:32

0

ответов

Изучение дерева решений и примеси

Есть три способа измерения примесей: каковы различия и подходящие варианты использования для каждого метода?

machine-learning data-mining random-forest decision-tree

вопрос задан: 8 November 2016 17:19

0

ответов

К какой информации мы можем получить доступ от клиента? [закрыто]

Я пытаюсь составить список информации, доступной через javascript, например: Геолокация IP-адрес Программное обеспечение браузера Место выхода {{ 1}} Местоположение входа Я понимаю, что пользователь может изменить любое ...

javascript data-mining data-retrieval

вопрос задан: 12 May 2016 15:46

0

ответов

Python Реализация алгоритма OPTICS (кластеризация)

Я ищу достойную реализацию алгоритм ОПТИКИ на Python. Я буду использовать его для формирования кластеров точек на основе плотности (пары (x, y)). Я ищу что-то, что принимает пары (x, y) ...

python machine-learning cluster-analysis data-mining optics-algorithm

вопрос задан: 21 April 2016 18:26

0

ответов

Как выполнить кластеризацию по среднему значению для данных временных рядов?

Как я могу сделать K-средство кластеризации данных временных рядов? Я понимаю, как это работает, когда входные данные представляют собой набор точек, но я не знаю, как кластеризовать временной ряд с 1XM, где M - это данные ...

matlab time-series cluster-analysis data-mining k-means

вопрос задан: 9 February 2016 21:27

0

ответов

Набор данных супермаркета для априорного алгоритма

«Мне нужно разработать программное обеспечение, предназначенное для бизнес-аналитика супермаркета «Future Stores», программное обеспечение выполняет анализ правила ассоциации на заданных переходных данных о продажах в супермаркете ...

apriori data-mining dataset integration-testing

вопрос задан: 21 January 2016 14:52

0

ответов

Простейший алгоритм выбора признаков

Я пытаюсь создать свой собственный простой алгоритм выбора признаков. Набор данных, с которым я собираюсь работать, находится здесь (очень известный набор данных). Может кто-нибудь подскажет, как это сделать? Я ...

algorithm machine-learning data-mining semantic-analysis

вопрос задан: 16 January 2016 10:58

0

ответов

Функция расстояния для смешанных переменных (категориальных и числовых)

Я хочу нечеткую кластеризацию набора заданий. Атрибуты вакансий: Категориальные: должность, диплом, навыки Числовые: зарплата, годы опыта Мой вопрос: как рассчитать расстояние между ...

cluster-analysis distance data-mining

вопрос задан: 16 January 2016 01:31

0

ответов

Поиск последовательности для предсказания времени и продукта

Я столкнулся с непростой проблемой поиска последовательности, скажем, у меня есть 10 продуктов, у меня есть миллионы записей, каждая из которых содержит пользователя, продукт и временную метку покупки. У каждого пользователя может быть только 1 запись или

algorithm artificial-intelligence machine-learning data-mining

вопрос задан: 14 January 2016 00:57

0

ответов

Как работает кластеризация (особенно кластеризация строк)?

Я слышал о кластеризации для группировки похожих данных. Я хочу знать, как это работает в конкретном случае для String. У меня есть таблица с более чем разными 100 000 слов. Я хочу определить одно и то же слово ...

string cluster-analysis data-mining

вопрос задан: 30 November 2015 15:51

0

ответов

Adding CURE clustering algorithm to WEKA

I have written a java program to perform CURE clustering. Я хочу добавить эту программу в weka в качестве алгоритма кластеризации и визуализировать кластеризацию. Кто-нибудь уже реализовал это на weka? Любые ссылки ...

java cluster-analysis weka data-mining

вопрос задан: 5 November 2015 16:09

0

ответов

DBMS_DATA_MINING.CREATE_MODEL вызывает «ORA-40103: недопустимый столбец идентификатора регистра: TID» на 11.2.0.1.0 64b, но на 10g ОК

У меня проблема с DBMS_DATA_MINING.CREATE_MODEL в версии 11.2. На 10g этот код ниже работает нормально, и я совершенно уверен, что на 11.1 он тоже работает. СОЗДАТЬ ИЛИ ЗАМЕНИТЬ ПРОСМОТР "SH". "ПУНКТЫ" КАК ВЫБРАТЬ ...

oracle oracle11g data-mining oracle11gr2

вопрос задан: 23 October 2015 10:44

0

ответов

Иерархическая кластеризация 1 миллиона объектов

Может ли кто-нибудь указать мне на инструмент иерархической кластеризации (предпочтительно на Python), который может кластеризовать ~ 1 миллион объектов? Я пробовал hcluster, а также Orange. У hcluster были проблемы с 18к объектами. Оранжевый ...

python machine-learning cluster-analysis data-mining hierarchical-clustering

вопрос задан: 13 October 2015 17:42

0

ответов

Как создать новую таблицу данных в Orange?

Я использую Orange (в Python) для некоторых задач интеллектуального анализа данных. Точнее, для кластеризации. Несмотря на то, что я прошел через руководство и прочитал большую часть документации, у меня все еще есть проблема. Все ...

python data-mining orange

вопрос задан: 15 September 2015 16:32

0

ответов

Показатели качества кластера

Предоставляет ли Matlab какое-либо средство для оценки методов кластеризации? (компактность кластеров и разделение кластеров..... )Или для этого есть какой-нибудь тулбокс?

cluster-analysis data-mining evaluation matlab

вопрос задан: 12 July 2015 11:33

0

ответов

Быстрый (

У меня есть 1 миллион 5-мерных точек, которые мне нужно сгруппировать в k кластеров с k << 1 миллион. В каждом кластере не должно быть двух точек слишком далеко друг от друга (например, они могут ограничивать сферы с ...

algorithm machine-learning cluster-analysis data-mining k-means

вопрос задан: 16 June 2015 21:16