1
ответ

Как выполнить FST (Преобразователь Конечного состояния) состав

Рассмотрите следующий FSTs: T1 0 1 a: b 0 2 b: b 2 3 b: b 0 0 a: 1 3 b: T2 0 1 b: 1 2 b: 1 1 a: d 1 2 a: c, Как я выполняю операцию состава на этих двух FSTs (т.е...
вопрос задан: 21 September 2012 17:23
1
ответ

который является лучшим ЛОГИЧЕСКИМ ЭЛЕМЕНТОМ … или [закрытым] RapidMiner

Я начал писать простой инструмент анализа мнений. В настоящее время я смотрю на ЛОГИЧЕСКИЙ ЭЛЕМЕНТ и RapidMiner, но новичком, который не в состоянии сконцентрироваться на обоих. Мог кто-то говорить мне который...
вопрос задан: 30 January 2012 18:23
1
ответ

Как автоматически пометить контент, необходимые алгоритмы и предложения

Я работаю с некоторыми действительно большими базами данных газетных статей, у меня они есть в базе данных MySQL, и я могу запрашивать их все . Сейчас я ищу способы помочь мне пометить эти статьи чем-то ...
вопрос задан: 18 May 2011 04:28
1
ответ

Как разделить заголовки/нижние колонтитулы из Проекта тексты Gutenberg?

Я попробовал различные методы для разделения лицензии из Проекта тексты Gutenberg для использования в качестве корпуса для проекта изучения языка, но я, может казаться, не придумываю безнадзорный, надежный подход...
вопрос задан: 14 April 2011 14:54
1
ответ

Как узнать, является ли предложение вопросом (вопросительным)?

Существует ли библиотека / алгоритм Java с открытым исходным кодом для определения, является ли конкретный фрагмент текста вопросом или нет? Я работаю над системой ответа на вопросы, которая должна анализировать, вводится ли текст с помощью ...
вопрос задан: 9 December 2010 16:04
1
ответ

Блок проверки грамматических ошибок CLI для определения времени

Мне нравится использовать настоящее время в моих журналах Мерзавца (например, "Добавьте опцию" вместо "Дополнительной функции"). В настоящее время я сделал, чтобы чрезвычайно наивный Мерзавец сцепился, который прерывает фиксацию если п
вопрос задан: 4 September 2010 19:55
1
ответ

Разбиение / Разложение сложных и составных предложений в nltk

Есть ли способ разложить сложные предложения на простые предложения в nltk или других библиотеках обработки естественного языка? Например: Парк такой чудесный, когда солнце садится и прохладно ...
вопрос задан: 17 August 2010 10:22
1
ответ

Устно отформатируйте число в Python

Как делают pythonistas печатают число как слова, как эквивалент кода языка Common LISP: [3]> (формат t "~r" 1e25) девять септильонов, девятьсот девяносто девять секстильонов, девятьсот девяносто-...
вопрос задан: 2 July 2010 06:52
1
ответ

Библиотеки обработки запроса на естественном языке

Я ищу библиотеки обработки Запроса на естественном языке для преобразования простого английского запроса в sql как операторы. Поскольку исключая, покажите список сотрудников, возраст которых равняется 30, должен быть преобразован в выбор *...
вопрос задан: 23 June 2010 12:31
1
ответ

PyParsing: Что действительно Объединяется (), делают?

Что является различием между: нечто = TOKEN1 + TOKEN2 и нечто = Объединение (TOKEN1 + TOKEN2) Спасибо. ОБНОВЛЕНИЕ: На основе моего экспериментирования кажется, что Объединение () для терминалов, где Вы...
вопрос задан: 30 May 2010 21:57
1
ответ

Лексический анализатор Python/YACC: Маркерный приоритет?

Я пытаюсь использовать зарезервированные слова в своей грамматике: зарезервированный = {'если': 'ЕСЛИ', 'то': 'ЗАТЕМ', 'еще': 'ЕЩЕ', 'в то время как': 'В ТО ВРЕМЯ КАК'} маркеры = ['DEPT_CODE', 'COURSE_NUMBER', 'OR_CONJ', '...
вопрос задан: 26 May 2010 05:45
1
ответ

Учитывая документ, выберите соответствующий отрывок

Когда я задаю вопрос здесь, подсказки для вопроса, возвращенного автоматическим поиском, учитывая первое немного вопроса, но достойный процент их не дает текста, который больше является...
вопрос задан: 14 May 2010 00:40
1
ответ

Даты родственника формата

Существует ли рубиновый драгоценный камень, который отформатирует даты относительно текущего времени? Я хочу вывод как "Завтра в 17:00", "В четверг на следующей неделе в 17:15", я не слишком обеспокоен точным выводом, так же, как...
вопрос задан: 20 April 2010 03:03
1
ответ

Может энергия, чтобы обнаружить естественный язык файла, затем загрузить корректный словарь?

Я использую несколько языков, и в настоящее время я обязан указать к энергии, с которой из них должна быть сделана проверка написания. Есть ли способ настроить энергию так, чтобы это автоматически обнаружило корректное...
вопрос задан: 27 March 2010 22:28
1
ответ

Пакет обработки естественного языка

Я начал работать над проектом, который требует Обработки естественного языка. Мы имеем, делают проверку правописания, а также отображение предложений к фразам и их синонимам. Я сначала думал об использовании ЛОГИЧЕСКОГО ЭЛЕМЕНТА...
вопрос задан: 5 March 2010 12:29
1
ответ

Анализ текста, извлечение факта, использование семантического анализа [закрытый] .NET

Я ищу любые свободные инструменты/компоненты/библиотеки, которые позволяют мне брать anvantage анализа текста, извлечения факта и семантического анализа в моем приложении.NET. Проект ЛОГИЧЕСКОГО ЭЛЕМЕНТА - то, в чем я нуждаюсь, но...
вопрос задан: 26 February 2010 21:55
1
ответ

Основанная на преобразовании частеречная разметка (метки камбалы-ромба)

Каковы слабые места и преимущества морфологического анализатора Брилла? Можно ли предложить некоторые возможные улучшения для теггера?
вопрос задан: 26 February 2010 13:30
1
ответ

Выполненный ЛОГИЧЕСКИЙ ЭЛЕМЕНТ конвейерно обрабатывает из программы Java без GUI. создайте приложение кота с логическим элементом

я создал некоторые сменные компоненты для ПРОПУСКАНИЯ и в сочетании с инструментами ANNIE, я выполняю конвейер в платформе ЛОГИЧЕСКОГО ЭЛЕМЕНТА. Кто-либо знает, как я могу выполнить конвейер от консоли? Я хочу создать...
вопрос задан: 31 January 2010 11:26
1
ответ

семантическая близость между предложениями

я делаю потребность project.i любой инструмент с открытым исходным кодом или техника для нахождения семантической близости между предложениями, где я даю вход как два предложения и произвожу как счет (т.е. семантическая близость) .can любой...
вопрос задан: 10 January 2010 17:30
1
ответ

Как использовать WordNet в SQL

Как использовать WordNet в базе данных SQL. Это существует где-нибудь, кто-то может дать мне шаг за шагом процедуру
вопрос задан: 5 August 2009 09:38
1
ответ

Существует ли синтаксический анализатор естественных языков для даты/времен в JavaScript?

Существует ли синтаксический анализатор естественных языков для даты/времен в JavaScript?
вопрос задан: 16 June 2009 18:54
1
ответ

Синтаксический анализатор даты естественного языка для рубина/направляющих

Кто-либо знает о чем-то подобном Date.js в Ruby? Что-то, что смогло бы возвратить объект даты из чего-то как: "две недели с сегодняшнего дня". Помнить Молочное веб-приложение соединяется...
вопрос задан: 4 June 2009 09:28
1
ответ

Какой инструментарий обработки естественного языка использовать в JAVA? [закрытый]

я работаю над проектом, который состоит из веб-сайта, который соединяется с NCBI (Национальный Центр информации о Биотехнологии) и ищет статьи там. Вещь состоит в том, что я должен сделать некоторый текст...
вопрос задан: 22 May 2009 00:09
0
ответов

Анализировать текст (лемматизация, редактировать расстояние)

Мне нужно проанализировать текст на наличие в нем запрещенных слов. Допустим, в черном списке есть слово: «Запретить». Слово имеет много форм. В тексте слово может быть, например: «запрещающий», «запрещенный», «...
вопрос задан: 7 July 2019 14:27
0
ответов

Создайте изящную статью из неструктурированного корпуса данных в python [в ожидании]

Я очень новичок в НЛП и машинном обучении (все еще учусь на веревках). Я имел в виду практическую проблему. У меня есть статья по информационной безопасности, которую я собираю каждые 3 дня. Мы обычно собираем данные ...
вопрос задан: 25 June 2019 19:14
0
ответов

Создание нового корпуса с помощью NLTK

Я подумал, что часто ответ на мой заголовок - пойти и прочитать документацию, но я пробежался по книге NLTK, но это не так » Я не могу дать ответ. Я новичок в Python. У меня есть куча .txt ...
вопрос задан: 9 June 2019 18:53
0
ответов

извлечение ключевых слов java

Существует ли простая в использовании библиотека Java, которая может принимать строку и возвращать набор строк, которые являются ключевыми словами / ключевыми фразами. Необязательно быть особенно умным, просто используйте стоп-слова и корчевание ...
вопрос задан: 26 April 2019 15:42
0
ответов

RASA NLU переоснащение объекта извлечения

Версия Rasa: 0.1.1 Версия Python: 3.7 Операционная система: osx Проблема: я делаю приложение, которое может выбирать объекты из списка покупок. Для первой версии я пытаюсь только с парой ...
вопрос задан: 14 April 2019 10:54
0
ответов

Создайте токены ngram, игнорируя числа, но не удаляя их из ngram

Я работаю над созданием токенов ngram из вектора предложений. Некоторые из этих предложений имеют номера в строке. Я хочу найти триграммы каждого предложения, где числа игнорируются в ...
вопрос задан: 14 April 2019 09:06
0
ответов

Реализация пакета -of -Наивный байесовский классификатор слов -Байесовский классификатор в NLTK

У меня в основном тот же вопрос, что и у этого парня. Пример в книге NLTK для наивного байесовского классификатора рассматривает только то, слово встречается в документе как функция.. оно не учитывает...
вопрос задан: 10 April 2019 21:33