3
ответа

Механизмы рекомендации для [закрытых] JAVA-приложений

Я задавался вопросом, существует ли какой-либо доступный механизм рекомендации с открытым исходным кодом? Это должно предложить что-то как Amazon и Netflix. Я услышал о платформе, названной Apache Mahout - Вкус. Я пробую...
вопрос задан: 20 March 2013 22:06
2
ответа

Использование Apache Mahout с Ruby on Rails

У меня есть рубин на приложении направляющих. У меня есть идея реализовать рекомендации в приложении. Я узнал о Apache Mahout через stackoverflow. Теперь, Если я должен использовать Mahout, что...
вопрос задан: 11 July 2010 14:47
2
ответа

Как использовать Mahout в среде Windows?

Я пытаюсь использовать Mahout в приложении, работающем на Windows. Я хочу создать кластеры из индекса lucene с помощью k-средств. Как только я должен создать файлы последовательности (создающий векторы из lucene...
вопрос задан: 2 May 2010 06:40
1
ответ

Рекомендации Mahout на Двоичных данных

Я - новичок к mahout. Моя цель состоит в том, чтобы произвести рекомендации на купленных данных двоичного пользователя. Таким образом, я применил модель подобия объекта объекта в вычислительной вершине N рекомендации для данных линзы фильма, принимающих 1
вопрос задан: 11 June 2010 12:36
1
ответ

mahout lucene практическое руководство кластеризации документов?

Я читаю, что могу создать mahout векторы из индекса lucene, который может использоваться для применения mahout кластеризирующиеся алгоритмы. http://cwiki.apache.org/confluence/display/MAHOUT/Creating+Vectors+from+...
вопрос задан: 27 February 2010 03:06
1
ответ

Плагин Mahout для рубина на направляющих

Я хочу использовать Apache Mahout в моем проекте на Ruby on Rails для реализации рекомендаций и совместной фильтрации. В особенности мои требования: предложение связанных тегов. предложение связано...
вопрос задан: 18 January 2010 05:51
1
ответ

Используя Apache [закрытые] библиотеки машинного обучения Mahout

Я работал с Apache машинное обучение Mahout libaries в мое свободное время за прошлые несколько недель. Мне любопытно услышать о том, как другие пользуются этими библиотеками.
вопрос задан: 30 October 2009 15:46
0
ответов

Использование mahout и hadoop

Я новичок, пытаясь понять, как mahout и hadoop будут использоваться для совместной работы фильтрация. У меня есть установка cassandra с одним узлом. Я хочу получить данные из cassandra Где я могу найти clear ...
вопрос задан: 19 July 2019 14:07
0
ответов

Извлечение/опознание сущностей с помощью бесплатных инструментов при питании Lucene Index

В настоящее время я исследую возможности извлечения имен людей, мест их нахождения, технических слов и категорий из текста (много статей из сети), который затем будет введен в индекс Lucene/ElasticSearch. ...
вопрос задан: 23 May 2017 12:00
0
ответов

Кластерирање (fkmeans) со Mahout со употреба на Clojure

Се обидувам да напишам кратка скрипта за да ги соберам моите податоци преку спој (иако повикувам часови на Махут). Јас ги имам моите влезни податоци во овој формат (што е излез од скрипта PHP) формат: (ознака) (слика) (...
вопрос задан: 23 May 2017 11:53
0
ответов

Как получить или сгенерировать тестовые данные для рекомендательной системы

В настоящее время я изучаю рекомендательные системы и хотел бы знать, как другие исследователи получают или генерируют тестовые данные для оценки производительности систем?
вопрос задан: 21 January 2016 14:48
0
ответов

Как напрямую отправить вывод преобразователя -в редюсер другого преобразователя -без сохранения вывода в hdfs

Проблема решена В конце концов проверьте мое решение в Внизу Недавно я пытаюсь запустить пример рекомендателя в листинге 6.1 ~6.4 )chaper6 (из Mahout в действии. Но я столкнулся с проблемой...
вопрос задан: 26 December 2015 18:53
0
ответов

Эквивалент Java Mahout в Python

Целью Mahout на основе Java является создание масштабируемых библиотек машинного обучения. Существуют ли какие-либо эквивалентные библиотеки в Python?
вопрос задан: 10 January 2015 14:46
0
ответов

Mahout: Чтобы прочитать пользовательский входной файл

, я играл с Mahout и обнаружил, что FileDataModel принимает данные в формате userId, itemId, pref (long, long, Double). У меня есть данные в формате String, long, double ...
вопрос задан: 10 July 2014 10:49
0
ответов

Есть ли опция seqFileDir для «clusterdump» в последней библиотеке «apache mahout»?

Я пытаюсь сделать «clusterdump» на выходе примера кластеризации mahout kmeans (пример synthetic_control). Но я получаю следующую ошибку: > ~/MAHOUT/trunk/bin/mahout clusterdump ...
вопрос задан: 26 April 2014 10:41
0
ответов

Как начать разработку mahout

После установки mahout из (http://girlincomputerscience.blogspot.com/2010/11/apache-mahout.html). Как запустить алгоритм mahout и откуда я могу получить самый популярный простой учебник для махаута ...
вопрос задан: 9 August 2013 13:52
0
ответов

Mahout исчерпывает пространство кучи

Я использую NaiveBayes для набора твитов используя Mahout. Два файла, один 100 МБ и один 300 МБ. Я изменил JAVA_HEAP_MAX на JAVA_HEAP_MAX = -Xmx2000m (раньше было 1000). Но даже тогда mahout бежал за ...
вопрос задан: 7 June 2013 11:40
0
ответов

Можно ли использовать apache mahout без зависимости от Hadoop?

Можно ли использовать Apache mahout без какой-либо зависимости от Hadoop. Я хотел бы использовать алгоритм mahout на одном компьютере, включив только библиотеку mahout в мой проект Java, но я ...
вопрос задан: 11 April 2013 22:08
0
ответов

Почему векторная нормализация может повысить точность кластеризации и классификации?

В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!
вопрос задан: 3 April 2013 01:08
0
ответов

стоит приобрести Mahout в действии, чтобы быстрее освоить Mahout, или есть другие лучшие источники?

В настоящее время я очень случайный пользователь Apache Mahout и подумываю о покупке книги Mahout в действии. К сожалению, мне очень трудно понять, сколько стоит эта книга ...
вопрос задан: 25 March 2013 19:11
0
ответов

Как создать/запустить эту простую программу Mahout, не получая исключений?

Я хотел бы запустить этот код, который я нашел в Mahout In Action :package org.help; импортировать java.io.IOException; импортировать java.util.ArrayList; импортировать java.util.List; импортировать org.apache.hadoop.conf....
вопрос задан: 11 October 2012 21:40
0
ответов

Рекомендации с использованием R с SimpleDB или BigQuery или с использованием PHP с SimpleDB

В настоящее время я работаю над системой, которая генерирует рекомендации по продуктам, например, на Amazon: «Люди, купившие это, также купили это ..» Текущий сценарий: Извлеките Google Аналитические данные ...
вопрос задан: 30 April 2012 18:24
0
ответов

Крупномасштабное машинное обучение — Python или Java? [закрыто]

В настоящее время я приступаю к проекту, который будет включать сканирование и обработку огромных объемов данных (сотни гигабайт), а также их анализ для извлечения структурированных данных, распознавания именованных сущностей, ...
вопрос задан: 15 March 2012 16:12
0
ответов

Amazon EC2 против PiCloud [закрыто]

Мы студенты, пытающиеся обрабатывать данные объемом около 140 миллионов записей и запускать несколько алгоритмов машинного обучения. мы новичок во всех облачных решениях и реализациях mahout....
вопрос задан: 11 March 2012 07:00
0
ответов

Получение исключения IOException при запуске примера кода в «Mahout в действии» на mahout-0.6

Я изучаю Mahout и читаю «Mahout в действии». Когда я попытался запустить образец кода в главе 7 SimpleKMeansClustering.java, выскочило исключение: Exception in thread "main" java.io ....
вопрос задан: 5 March 2012 11:40
0
ответов

Как программно определить, относится ли URL-адрес к веб-сайту электронной коммерции или нет?

В проекте есть модуль, который принимает URL-адрес и определяет, относится ли он к веб-сайту электронной коммерции или не связанному с электронной торговлей. Я пробовал следующие подходы: Использование Apache mahout, Классификация: URL ---> ...
вопрос задан: 22 January 2012 15:01
0
ответов

Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися как CSV?

У меня есть файл, содержащий векторы данных, где каждая строка содержит список, разделенный запятыми ценностей. Мне интересно, как выполнить кластеризацию k-средних для этих данных с помощью mahout. Пример, приведенный в ...
вопрос задан: 9 January 2012 08:01
0
ответов

Полное использование всех ядер в псевдораспределенном режиме Hadoop

Я выполняю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу убедиться, что все ядра используются эффективно. В настоящее время мой счетчик вакансий показывает, что одновременно выполняется только одно задание. Есть ли ...
вопрос задан: 2 December 2011 14:04
0
ответов

Проблемы производительности Apache Mahout

Последние несколько дней я работал с Mahout, пытаясь создать рекомендательный движок. Проект, над которым я работаю, имеет следующие данные: 12M пользователей 2M элементов 18M user-item boolean ...
вопрос задан: 23 November 2011 10:11
0
ответов

Использование Neo4j в качестве хранилища данных Mahout

Кто-нибудь успешно интегрировал Apache Mahout с Neo4j в качестве хранилища данных? Если да, то сколько работы было проделано и какова была производительность?
вопрос задан: 11 October 2011 20:27