0
ответов

Разница между классификацией и кластеризацией в интеллектуальном анализе данных? [закрыто]

Может кто-нибудь объяснить, в чем разница между классификацией и кластеризацией в интеллектуальном анализе данных? Если можете, приведите примеры того и другого, чтобы понять основную идею.
вопрос задан: 23 July 2018 22:34
0
ответов

Полезные функции, используемые в сентиментальном анализе

Я работаю над проектом «Анализ текста», а именно «Сентиментальное обнаружение». Я новичок в этом вопросе, поэтому я хотел бы спросить вас, какие самые важные, необходимые и полезные функции используются для чистых ...
вопрос задан: 13 July 2018 20:39
0
ответов

Как дерево решений вычисляет атрибут разделения?

Когда мы используем какой-либо алгоритм дерева решений и наши данные набор состоит из числовых значений. Я обнаружил, что результаты, предоставляемые программой, разбивают узел на значения, которые даже не существуют в ...
вопрос задан: 27 June 2018 16:31
0
ответов

Как подойти к алгоритму игры в угадывание чисел (с изюминкой)?

Я изучаю программирование (Python и алгоритмы) и пытался работать над проектом, который мне показался интересным. Я создал несколько базовых скриптов Python, но я не уверен, как подойти к решению ...
вопрос задан: 29 April 2018 07:24
0
ответов

Почему одно горячее кодирование улучшает производительность машинного обучения?

Я заметил, что когда кодирование One Hot используется для определенного набора данных (матрицы) и используется в качестве обучающих данных для алгоритмов обучения, это дает значительно лучшие результаты в отношении ...
вопрос задан: 20 October 2017 11:45
0
ответов

Является ли DLIB хорошей библиотекой с открытым исходным кодом для разработки моих собственных алгоритмов машинного обучения на C ++?

Является ли DLIB хорошей библиотекой с открытым исходным кодом для разработки моих собственных алгоритмов машинного обучения на C ++? Как насчет других, таких как libSVM, SHOGUN?
вопрос задан: 12 June 2017 05:27
0
ответов

Поддержка Java для PMML

Я новичок в PMML: Predictive Masmy Markup Language (www.dmg.org), и мне было интересно, если есть какая-то поддержка Java ( Открытый источник / профессионал) для создания / анализа файлов PMML. Первоначально я ...
вопрос задан: 23 May 2017 12:29
0
ответов

Автоопределение CSV в Java

Каким будет надежный способ автоопределения того, что файл действительно является CSV, если CSV будет переопределен как "Character-Separated Values", т.е. данные, использующие любой отдельный символ (но обычно любой не...
вопрос задан: 23 May 2017 12:06
0
ответов

Объединение концептуально похожих документов вместе?

Это скорее концептуальный вопрос, чем реальная реализация, и я надеюсь, что кто-то сможет прояснить это. Моя цель заключается в следующем: учитывая набор документов, я хочу сгруппировать их таким образом, чтобы документы ...
вопрос задан: 23 May 2017 12:01
0
ответов

Wat sinn e puer gutt Weeër fir "ongeféier" semantesch Ähnlechkeet tëscht Sätz ze schätzen?

Ech hunn den nlp Tag op SO fir déi lescht Stonne gekuckt an sinn zouversiichtlech datt ech näischt verpasst hunn awer wann ech gelift, weist mir weg op d'Fro. An der Tëschenzäit awer, wäert ech ...
вопрос задан: 23 May 2017 11:46
0
ответов

Выбор функций и обучение без учителя для многоязычных данных + выбор алгоритма машинного обучения

Вопросы Я хочу классифицировать / категоризировать / кластеризовать / сгруппировать набор из нескольких тысяч веб-сайтов. Есть данные, на которых мы можем обучаться, поэтому мы можем проводить контролируемое обучение, но это не данные, которые мы ...
вопрос задан: 23 May 2017 10:33
0
ответов

Кластеризация массива одномерных чисел [дубликат]

Возможный дубликат :Кластеризация одномерных данных -оптимально? Допустим, у меня есть такой массив :[1,1,2,3,10,11,13,67,71] Есть ли удобный способ разбить массив на что-то вроде...
вопрос задан: 23 May 2017 10:31
0
ответов

Обнаружение «шаблонов» в данном тексте?

Если у меня есть значительный объем текста и я пытаюсь обнаружить наиболее часто встречающиеся шаблоны, я думал решить эту проблему с помощью N- Подход по Грамму, и на самом деле он был предложен в качестве решения ...
вопрос задан: 23 May 2017 10:27
0
ответов

msysgit: предупреждение о шрифте Unicode

Недавно я получаю эту ошибку при использовании msysgit, в частности, когда есть некоторый не-ASCII-контент, сгенерированный git вывод: предупреждение: ваш консольный шрифт, вероятно, не поддерживает Unicode. Если ...
вопрос задан: 30 April 2017 13:03
0
ответов

кластеризация и matlab

Я пытаюсь сгруппировать некоторые данные, которые у меня есть из набора данных чашки KDD 1999, выходные данные файла выглядят следующим образом: 0, tcp, http, SF, 239,486,0,0,0, 0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0 ....
вопрос задан: 27 January 2017 22:32
0
ответов

Изучение дерева решений и примеси

Есть три способа измерения примесей: каковы различия и подходящие варианты использования для каждого метода?
вопрос задан: 8 November 2016 17:19
0
ответов

К какой информации мы можем получить доступ от клиента? [закрыто]

Я пытаюсь составить список информации, доступной через javascript, например: Геолокация IP-адрес Программное обеспечение браузера Место выхода {{ 1}} Местоположение входа Я понимаю, что пользователь может изменить любое ...
вопрос задан: 12 May 2016 15:46
0
ответов

Python Реализация алгоритма OPTICS (кластеризация)

Я ищу достойную реализацию алгоритм ОПТИКИ на Python. Я буду использовать его для формирования кластеров точек на основе плотности (пары (x, y)). Я ищу что-то, что принимает пары (x, y) ...
вопрос задан: 21 April 2016 18:26
0
ответов

Как выполнить кластеризацию по среднему значению для данных временных рядов?

Как я могу сделать K-средство кластеризации данных временных рядов? Я понимаю, как это работает, когда входные данные представляют собой набор точек, но я не знаю, как кластеризовать временной ряд с 1XM, где M - это данные ...
вопрос задан: 9 February 2016 21:27
0
ответов

Набор данных супермаркета для априорного алгоритма

«Мне нужно разработать программное обеспечение, предназначенное для бизнес-аналитика супермаркета «Future Stores», программное обеспечение выполняет анализ правила ассоциации на заданных переходных данных о продажах в супермаркете ...
вопрос задан: 21 January 2016 14:52
0
ответов

Простейший алгоритм выбора признаков

Я пытаюсь создать свой собственный простой алгоритм выбора признаков. Набор данных, с которым я собираюсь работать, находится здесь (очень известный набор данных). Может кто-нибудь подскажет, как это сделать? Я ...
вопрос задан: 16 January 2016 10:58
0
ответов

Функция расстояния для смешанных переменных (категориальных и числовых)

Я хочу нечеткую кластеризацию набора заданий. Атрибуты вакансий: Категориальные: должность, диплом, навыки Числовые: зарплата, годы опыта Мой вопрос: как рассчитать расстояние между ...
вопрос задан: 16 January 2016 01:31
0
ответов

Поиск последовательности для предсказания времени и продукта

Я столкнулся с непростой проблемой поиска последовательности, скажем, у меня есть 10 продуктов, у меня есть миллионы записей, каждая из которых содержит пользователя, продукт и временную метку покупки. У каждого пользователя может быть только 1 запись или
вопрос задан: 14 January 2016 00:57
0
ответов

Как работает кластеризация (особенно кластеризация строк)?

Я слышал о кластеризации для группировки похожих данных. Я хочу знать, как это работает в конкретном случае для String. У меня есть таблица с более чем разными 100 000 слов. Я хочу определить одно и то же слово ...
вопрос задан: 30 November 2015 15:51
0
ответов

Adding CURE clustering algorithm to WEKA

I have written a java program to perform CURE clustering. Я хочу добавить эту программу в weka в качестве алгоритма кластеризации и визуализировать кластеризацию. Кто-нибудь уже реализовал это на weka? Любые ссылки ...
вопрос задан: 5 November 2015 16:09
0
ответов

DBMS_DATA_MINING.CREATE_MODEL вызывает «ORA-40103: недопустимый столбец идентификатора регистра: TID» на 11.2.0.1.0 64b, но на 10g ОК

У меня проблема с DBMS_DATA_MINING.CREATE_MODEL в версии 11.2. На 10g этот код ниже работает нормально, и я совершенно уверен, что на 11.1 он тоже работает. СОЗДАТЬ ИЛИ ЗАМЕНИТЬ ПРОСМОТР "SH". "ПУНКТЫ" КАК ВЫБРАТЬ ...
вопрос задан: 23 October 2015 10:44
0
ответов

Иерархическая кластеризация 1 миллиона объектов

Может ли кто-нибудь указать мне на инструмент иерархической кластеризации (предпочтительно на Python), который может кластеризовать ~ 1 миллион объектов? Я пробовал hcluster, а также Orange. У hcluster были проблемы с 18к объектами. Оранжевый ...
вопрос задан: 13 October 2015 17:42
0
ответов

Как создать новую таблицу данных в Orange?

Я использую Orange (в Python) для некоторых задач интеллектуального анализа данных. Точнее, для кластеризации. Несмотря на то, что я прошел через руководство и прочитал большую часть документации, у меня все еще есть проблема. Все ...
вопрос задан: 15 September 2015 16:32
0
ответов

Показатели качества кластера

Предоставляет ли Matlab какое-либо средство для оценки методов кластеризации? (компактность кластеров и разделение кластеров..... )Или для этого есть какой-нибудь тулбокс?
вопрос задан: 12 July 2015 11:33