5
ответов

Решение для обработки естественного языка в Java? [дубликат]

Есть ли какие-либо одинаково большие пакеты как NTLK Python в мире Java?
вопрос задан: 17 June 2010 00:01
5
ответов

Алгоритм для классификации списка продуктов? [закрытый]

У меня есть список, представляющий продукты, которые являются более или менее тем же. Например, в списке ниже, они - все жесткие диски Seagate. Жесткий диск 500Go Seagate Жесткий диск 120Go Seagate для ноутбука...
вопрос задан: 22 May 2010 20:35
5
ответов

Алгоритм для отрицания предложений

Я задавался вопросом, был ли кто-либо знаком с какими-либо попытками алгоритмического отрицания предложения. Например, учитывая предложение как "Эта книга хорошо", обеспечивают любое количество значения альтернативных наказаний...
вопрос задан: 24 April 2010 09:22
5
ответов

Как автоматически определить текстовое качество?

Большому количеству алгоритмов Обработки естественного языка (NLP) и библиотек нелегко работать со случайными текстами от сети, обычно потому что они предполагают чистую, членораздельную запись. Я могу...
вопрос задан: 15 February 2010 13:59
5
ответов

Создайте модель естественного языка, которая фиксирует орфографические ошибки

Что является книгами о том, как создать программу синтаксического анализа естественных языков как это: вход: Я добрался до ВЫСОКОГО, который Вы производите: Я добрался, чтобы СКАЗАТЬ, что Вы вводите: Большое поле RAT произвело: Большое поле RED в: ого-го
вопрос задан: 10 February 2010 13:14
5
ответов

Изящный парсинг команды в ОСНОВАННОЙ НА ООП текстовой игре

Я играю с записью приключения MUD/текста (не смейтесь) в Ruby. Кто-либо может дать мне какие-либо подсказки к изящному, основанному на ООП решению парсинга входного текста? Мы говорим о...
вопрос задан: 5 February 2010 14:53
5
ответов

Как Статистически Невероятные Фразы Amazon работают?

Как чему-то нравится Статистически Невероятная работа Фраз? По словам амазонки: Статистически Невероятные Фразы Amazon.com или "ГЛОТКИ", являются самыми отличительными фразами в тексте...
вопрос задан: 6 January 2010 03:24
5
ответов

Вычисление контекстно-зависимой текстовой корреляции

Предположим, что я хочу соответствовать записям адреса (или имена человека или безотносительно) друг против друга для слияния записей, которые, скорее всего, относятся к тому же адресу. В основном я предполагаю, что хотел бы...
вопрос задан: 3 December 2009 15:50
5
ответов

Алгоритмы для обнаружения фраз и ключевых слов из текста

У меня есть приблизительно 100 мегабайтов текста, без любой разметки, разделенной приблизительно к 10 000 записей. Я хотел бы автоматически генерировать список 'тега'. Проблема состоит в том, что существуют словосочетания (т.е.
вопрос задан: 29 October 2009 16:40
5
ответов

Как определить предмет, возразите и другие слова?

Я пытаюсь реализовать приложение, которое может определить значение предложения путем деления его к мелким кусочкам. Таким образом, я должен знать, какие слова подвергаются, возражают и т.д. так, чтобы моя программа могла знать как к...
вопрос задан: 24 August 2009 14:19
5
ответов

Обработка естественного языка классифицирует предложения/абзац как забавные

Есть ли способ классифицировать конкретное предложение/абзац как забавное. Существует очень немного указателей как, туда, где нужно пойти далее на этом.
вопрос задан: 14 February 2009 11:14
5
ответов

Проблема, обрезающая японскую строку в Java

У меня есть следующая строка (японский язык) " ユーザー名", первый символ похож на пробел, но его число в unicode 12288, поэтому если я делаю " ユーザー名" .trim (), я получаю ту же строку (обрезка не работает). Если...
вопрос задан: 28 January 2009 00:06
4
ответа

Как лучше всего проанализировать простую грамматику?

Хорошо, таким образом, я спросил набор меньших вопросов об этом проекте, но у меня все еще нет большой уверенности в проектах, я придумываю, таким образом, я собираюсь задать вопрос в более широком масштабе. Я...
вопрос задан: 19 February 2018 22:12
4
ответа

Как извлечь распространенный / значительные фразы от ряда вводов текста

У меня есть серия текстовых объектов - необработанный HTML от базы данных MySQL. Я хочу найти наиболее распространенные фразы в этих записях (не единственная наиболее распространенная фраза, и идеально, не осуществляя слово в слово...
вопрос задан: 26 November 2017 10:40
4
ответа

Обработка естественного языка в [закрытом] Ruby

Я надеюсь делать некоторый синтаксический разбор (главным образом для приложений Твиттера) и вывожу некоторые общие характеристики. Есть ли какие-либо хорошие библиотеки обработки естественного языка для этого вида вещи в Ruby?...
вопрос задан: 23 May 2017 12:02
4
ответа

Что означают теги части речи и зависимости spaCy?

spaCy помечает каждый токен в документе частью речи (в двух разных форматах, один хранится в свойствах токена pos и pos_, а другой - в теге и теге ...
вопрос задан: 29 October 2016 12:00
4
ответа

Нечеткая библиотека поиска строки в [закрытом] Java

Я ищу высокопроизводительную библиотеку Java для нечеткого поиска строки. Существуют многочисленные алгоритмы для нахождения подобных строк, расстояния Левенштейна, Daitch-Mokotoff Soundex, n-граммы и т.д. Что Java...
вопрос задан: 19 September 2016 16:31
4
ответа

Вычисления точности и полноты в Выделении именованных сущностей

Теперь я собираюсь сообщить о результатах Выделения именованных сущностей. Одна вещь, которую я нахожу немного сбивающими с толку, состоит в том, что мое понимание точности и полноты было то, что каждый просто подводит итог истинных положительных сторон..
вопрос задан: 12 March 2016 13:30
4
ответа

Корреляция, кластеризирующаяся в R

Я хотел бы использовать кластеризацию корреляции и меня, рисунок R является хорошим местом для запуска. Я могу представить данные R как ряд больших, редких векторов или как таблица с предварительно вычисленной матрицей несходства...
вопрос задан: 29 February 2016 09:35
4
ответа

NLTK WordNet Lemmatizer: Разве это не должно лемматизировать все склонения слова?

Я использую NLTK WordNet Lemmatizer для проекта тегирования части речи, сначала модифицируя каждое слово в учебном корпусе до его основы (на месте модификации), а затем тренируюсь только на новом ...
вопрос задан: 12 April 2015 15:24
4
ответа

Обнаружение слогов в слове

Мне нужно найти достаточно эффективный способ обнаружения слогов в слове. Например, Invisible -> in-vi-sib-le. Существуют некоторые правила слоговости, которые можно использовать: V CV VC CVC CCV CCCV CVCC *, где V - это ...
вопрос задан: 20 February 2015 03:14
4
ответа

Поиск [закрытой] библиотеки программы проверки правописания Java

Я ищу библиотеку проверки правописания Java с открытым исходным кодом, которая имеет словари, по крайней мере, для следующих языков: французский, немецкий, испанский и чешский язык. Какое-либо предложение?
вопрос задан: 20 September 2014 21:23
4
ответа

Обработка естественного языка - выравнивание слов

Я ищу инструменты выравнивания слов и алгоритмы. Я имею дело с двуязычным английским языком - текст хинди и в настоящее время работаю над DTW (Динамическое Время, Деформируясь) алгоритм CLA (Конкурентоспособное Соединение...
вопрос задан: 23 July 2012 20:31
4
ответа

Естественные английские слова языка

Мне нужен самый исчерпывающий английский список слов, который я могу найти для нескольких типов операций обработки языка, но я ничего не мог найти в Интернете, который имеет достаточно хорошее качество. Существуют 1...
вопрос задан: 19 June 2012 13:05
4
ответа

Неструктурированный текст к структурированным данным

Я ищу ссылки (учебные руководства, книги, академическая литература) относительно структурирования неструктурированного текста способом, подобным быстрому Google Календарю, добавляют кнопку. Я понимаю, что это может прибыть...
вопрос задан: 17 July 2010 02:37
4
ответа

Java или распределенный Python вычисляют задание (на студенческом бюджете)?

У меня есть большой набор данных (c. 40G), что я хочу использовать для некоторой обработки естественного языка (в основном смущающе параллельный) по нескольким компьютерам в лаборатории, к которой у меня нет корневого доступа и только 1G пространства поль
вопрос задан: 16 May 2010 14:28
4
ответа

Проблема классификации текстов Java [закрывается]

У меня есть ряд Книжных объектов, класс Книга определяется как следующее: Книга Класса {Строковый заголовок; ArrayList <теги> taglist;}, Где заголовок является заголовком книги, примера: Javascript для...
вопрос задан: 13 May 2010 00:11
4
ответа

Где я могу найти список английских фраз? [закрытый]

Для меня определяют задачу с поиском использования клише и общих фраз в тексте. Фразы подобны фразам, Вы могли бы видеть загадки фразы на Колесе фортуны. Вот несколько примеров:...
вопрос задан: 24 April 2010 09:27
4
ответа

поколение тега от текстового содержания

Мне любопытно, если существует алгоритм/метод, существует для генерации ключевых слов/тегов из данного текста, при помощи некоторых расчетов веса, отношения возникновения или других инструментов. Кроме того, я буду благодарен...
вопрос задан: 18 April 2010 23:02
4
ответа

Определение контекста слова - Python

Я думаю, что это - интересный вопрос, по крайней мере, для меня. У меня есть список слов, скажем: фотография, бесплатная, поисковая, изображение, css3, CSS, учебные руководства, webdesign, учебное руководство, Google, фарфор, цензура...
вопрос задан: 24 March 2010 18:17