0
ответов

TF -IDF Simple Use -NLTK/Scikit Learn

Хорошо, поэтому я немного смущен. Однако это должен быть простой прямой вопрос. После вычисления TF -IDF Matrix of the Document по всему корпусу я получаю очень похожий результат...
вопрос задан: 8 August 2012 17:47
0
ответов

Java-выход stanford core nlp

Я новичок с набором инструментов Java и Stanford NLP и пытаюсь использовать их для проекта. В частности, я пытаюсь использовать инструментарий Stanford Corenlp для аннотирования текста (с помощью Netbeans, а не командной строки )...
вопрос задан: 8 August 2012 06:52
0
ответов

Поиск тем невидимого документа через Gensim

Я использую Gensim для крупномасштабного -тематического моделирования. Мне трудно понять, как определить прогнозируемые темы для невидимого (не -не проиндексированного )документа. Например :У меня 25 млн...
вопрос задан: 14 July 2012 13:02
0
ответов

Алгоритмы/теория, лежащие в основе предиктивного автозаполнения?

Простое автозаполнение слов просто отображает список слов, которые соответствуют уже введенным символам. Но хотелось бы упорядочить слова в списке автозаполнения по вероятности...
вопрос задан: 12 July 2012 10:35
0
ответов

Парсер НЛП в Haskell [закрыто]

Есть ли в Haskell хороший (парсер )естественного языка (b )таггер части речи (c )библиотека nlp (а-ля nltk python)
вопрос задан: 11 July 2012 08:33
0
ответов

Какой подход к простой обработке текста в Haskell?

Я пытаюсь выполнить простую обработку текста в Haskell, и мне интересно, как лучше всего это сделать на языке FP. Я посмотрел на модуль parsec, но это кажется намного больше...
вопрос задан: 11 July 2012 01:06
0
ответов

Как искать строку в классе в c#

Я разрабатываю приложение, в котором у меня есть некоторые данные, полученные из сети в класс. Класс является открытым классом Деталь { общедоступное имя строки { получить; набор; } public List education {...
вопрос задан: 10 July 2012 07:40
0
ответов

извлечение ключевого слова python nltk из предложения

«Первое, что мы сделаем, давайте убьем всех адвокатов». -Уильям Шекспир Учитывая приведенную выше цитату, я хотел бы выделить «убить» и «адвокаты» в качестве двух важных ключевых слов для описания общего...
вопрос задан: 10 July 2012 05:07
0
ответов

Методы автоматического обнаружения синонимов

В настоящее время я работаю над подходом к классификации коротких документов, основанным на нейронных сетях, и, поскольку корпуса, с которыми я работаю, обычно содержат около десяти слов, стандартный статистический документ...
вопрос задан: 6 July 2012 22:03
0
ответов

Распознавание именованных объектов NLTK с пользовательскими данными

Я пытаюсь извлечь именованные объекты из своего текста, используя NLTK. Я считаю, что NLTK NER не очень точен для моей цели, и я также хочу добавить еще несколько собственных тегов. Я пытался найти...
вопрос задан: 4 July 2012 18:24
0
ответов

NLTK назвала распознавание объектов на голландском языке

Я пытаюсь извлечь именованные сущности из голландского текста. Я использовал трейнер nltk -для обучения таггера и чанчера на голландском корпусе conll2002. Однако метод разбора из чанкера не обнаруживает...
вопрос задан: 2 July 2012 11:54
0
ответов

SharpNLP как файл с расширением.nbin [закрыто]

Я скачал SharpNLP с этого сайта http://sharpnlp.codeplex.com/но он загрузил файл.nbin, с которым я не знаю, что делать. Любая помощь pleeeeeeease?
вопрос задан: 1 July 2012 01:56
0
ответов

Проверка грамматики английского языка

Я ищу простую библиотеку C#, которая делает следующее: Берет строку, представляющую одно предложение, и возвращает логическое выражение, если оно грамматически правильное. Я не смог найти...
вопрос задан: 25 June 2012 01:37
0
ответов

Как использовать пользовательские классификаторы в ансамблевых классификаторах в sklearn?

Я читал, что встроенные методы ансамбля в sklearn используют деревья решений в качестве базовых классификаторов. Можно ли вместо этого использовать пользовательские классификаторы?
вопрос задан: 23 June 2012 13:19
0
ответов

Словарные слова для загрузки

Может кто-нибудь подсказать, где найти словарный список с частотной информацией? В идеале источником должны быть английские слова североамериканского разнообразия.
вопрос задан: 19 June 2012 13:43
0
ответов

Обнаружить местоимение и его существительное?

Интересно, есть ли какой-нибудь инструмент, который может помочь мне определить местоимение имени в тексте. Пример Джон испанец. Он может говорить по-немецки. Как я могу пометить He для Jone?
вопрос задан: 16 June 2012 15:00
0
ответов

Выберите или сгенерируйте канонический вариант из нескольких предложений

Я работаю с API, который сопоставляет мои запросы GTIN/EAN с данными о продукте. Поскольку возвращаемые данные поступают из каналов торговых продуктов, почти повсеместно используется следующее: Множественные результаты ...
вопрос задан: 13 June 2012 23:34
0
ответов

Извлечение существительных фраз из текстового файла с помощью стэнфордского типизированного парсера

У меня есть текст, из которого я хочу извлечь существительные фразы. Я могу легко получить набранный парсер для текста, который у меня есть, но интересно, как я могу извлечь существительные фразы в тексте?
вопрос задан: 12 June 2012 00:16
0
ответов

Как получить словоизменение с помощью Wordnet

Я хочу получить словоизменение с помощью Wordnet. Например. Если слово make, то его флексии сделаны, make, make Я перепробовал все варианты команды wn, но не получил...
вопрос задан: 8 June 2012 22:57
0
ответов

Строка поиска для чисел

У меня есть чат-бот на javascript, где человек может ввести в поле ввода любой вопрос, который ему нравится, и надеяться получить точный ответ. Я могу это сделать, но я знаю, что делаю все неправильно, потому что я не...
вопрос задан: 7 June 2012 23:53
0
ответов

Корпус фраз для сентиментального анализа

Добрый день, Я пытаюсь написать приложение для сентиментального анализа на питоне (используя классификатор наивного байеса) с целью классифицировать фразы из новостей как положительные или отрицательные. А у меня...
вопрос задан: 28 May 2012 19:56
0
ответов

Алгоритмы распознавания образов в Node.js или PHP?

Я хотел бы начать экспериментировать с алгоритмами, которые распознают закономерности в данных. Я имею дело со многими типами последовательностей (пиксели изображения, ввод текста, движение пользователя), и было бы интересно использовать...
вопрос задан: 26 May 2012 16:54
0
ответов

Методы извлечения регулярных выражений из помеченного набора данных

Предположим, у меня есть набор данных из нескольких сотен тысяч строк (которые, если это имеет значение, являются предложениями на естественном языке), каждая из которых помечена определенным " метка". Каждое предложение помечено...
вопрос задан: 24 May 2012 16:00
0
ответов

Как рассчитать вероятности из матриц путаницы? нужен знаменатель, матрицы символов

Эта статья содержит матрицы путаницы для орфографических ошибок в зашумленном В нем описывается, как исправлять ошибки на основе условных свойств. Вычисление условной вероятности находится на ...
вопрос задан: 22 May 2012 19:33
0
ответов

Токенизация и индексация с помощью Lucene, как справиться с внешней токенизацией и частью речи?

Я хотел бы создать свой собственный — здесь не уверен, какой именно — токенизатор (с точки зрения Lucene) или собственный анализатор. Я уже пишу код, который токенизирует мои документы в слове (в виде списка ...
вопрос задан: 21 May 2012 15:54
0
ответов

Реконструкция минимального расстояния редактирования

Я знаю, что в стеке есть похожие ответы, а также в Интернете, но я чувствую, что что-то упускаю. Учитывая приведенный ниже код, нам нужно восстановить последовательность событий, которые привели к результату...
вопрос задан: 20 May 2012 17:18
0
ответов

Подсчитайте глаголы, существительные и другие части речи с помощью NLTK Python

У меня есть несколько текстов, и я хотел бы создать их профили на основе использования ими различных частей речи, таких как существительные и глаголы. По сути, мне нужно подсчитать, сколько раз каждая часть речи...
вопрос задан: 20 May 2012 15:41
0
ответов

Наборы фейковых отзывов

В Интернете есть наборы данных с обычным почтовым спамом, но мне нужны наборы данных с фейковыми отзывами для проведения исследований и я не могу найти ни одного из них. Кто-нибудь может подсказать, где фейковые отзывы...
вопрос задан: 18 May 2012 11:29
0
ответов

Что такое эксперимент Oracle?

Я прочитал статью о машинном обучении, и в ней содержится эксперимент Oracle для сравнения его исследования с другим исследованием? Но не кажется таким уж ясным, что такое эксперимент Oracle?
вопрос задан: 11 May 2012 14:29
0
ответов

Создание пользовательского категоризированного корпуса в NLTK и Python

У меня возникла небольшая проблема, связанная с регулярными выражениями и CategorizedPlaintextCorpusReader в Python. Я хочу создать собственный категоризированный корпус и обучить наивному -байесовскому методу...
вопрос задан: 6 May 2012 00:36