2
ответа

Представление RDF предложений

Я должен представить предложения в формате RDF. Другими словами, "John любит кокс", был бы автоматически представлен как: Тема: John Predicate: Любит Объект: Кока-кола Делает любой знает, где я должен...
вопрос задан: 15 April 2015 21:12
2
ответа

У меня есть список кодов страны и список кодов языка. Как я отображаюсь от кода страны до кода языка?

Когда пользователь посещает сайт, я могу получить их код страны. Я хочу использовать это для установки языка по умолчанию (который они могут позже изменить при необходимости, просто общее предположение относительно какой язык они...
вопрос задан: 20 June 2014 17:01
2
ответа

Лемматизация [закрытый] Java

Я ищу реализацию лемматизации для английского языка в Java. Я уже нашел некоторых, но мне нужно что-то, что не должно к большой памяти работать (вершина на 1 ГБ).Спасибо. Мне не нужен стеммер.
вопрос задан: 6 March 2014 11:34
2
ответа

Получение разных форм глаголов [дубликат]

В настоящее время я использую wordnet для получения значения слов следующим образом. от nltk.corpus import wordnet syns = wordnet.synsets («думаю») Мне интересно узнать, можно ли получить разные ...
вопрос задан: 22 September 2013 10:05
2
ответа

Библиотека Java, которая находит границы предложения

Кто-либо знает о библиотеке Java, которая обрабатывает границы предложения открытия? Я думаю, что это была бы умная реализация StringTokenizer, которая знает обо всех разделителях предложения это...
вопрос задан: 24 February 2013 12:20
2
ответа

R: Шпалы? Как бороться с ошибками при извлечении с использованием больших циклов? [Дубликат]

Я был бы так благодарен за любой совет - даже источник для расследования. Я являюсь количественным исследователем социальных наук, и мои навыки программирования быстро улучшаются, но я все еще новичок. ...
вопрос задан: 7 February 2013 16:52
2
ответа

Распознавание языка в [закрытом] Java

Действительно ли там какое-либо распознавание языка является открытым исходным кодом для Java? Найденный только для c/c ++. UPD: я говорю о человеческом текстовом языке. Пример: Вход: Меня зовут John. Вывод: английский язык. Вход: Ich heisse John...
вопрос задан: 18 November 2012 11:24
2
ответа

Грамматика естественного языка и вводимые пользователями имена

Некоторые языки, особенно славянские языки, изменяют окончания имен людей согласно грамматическому контексту. (Для тех из Вас, кто знает грамматику или изученные языки, которые делают это к словам...
вопрос задан: 28 April 2012 20:58
2
ответа

Общие рамки для подготовки обучающих данных? [закрытый]

Как студент компьютерной лингвистики, я часто делаю эксперименты машинного обучения, где я должен подготовить обучающие данные от всех видов различных ресурсов как сырые данные или аннотируемые корпусы текстов...
вопрос задан: 27 September 2011 01:43
2
ответа

Обнаружение времен английского глагола используя NLTK

Я ищу способ, с помощью которого можно найти глагольные фразы для английского текста в прошедшем, настоящем и будущем временах. На данный момент я использую NLTK, делаю POS (Part-Of-Speech) тегирование, а затем подсчитываю, скажем, «VBD», чтобы получить
вопрос задан: 30 March 2011 12:42
2
ответа

алгоритм для вычисления сходства между текстами

Я пытаюсь оценить сходство между постами из социальных сетей, но не нашли хороших алгоритмов для этого, мысли? Я только что попробовал Левенштейна, JaroWinkler и других, но их больше ...
вопрос задан: 27 August 2010 16:24
2
ответа

как установить фокус на конкретную ячейку инструментария WPF datagrid

Я использую обеспеченное управление DataGrid инструментария WPF для отображения списка продуктов наряду с его OpenStock, Описания и т.д. В этом DataGrid я установил столбец OpenStock на доступный для редактирования, и отдых недоступны для редактирования..
вопрос задан: 6 August 2010 06:53
2
ответа

как я создаю свой собственный тренировочный корпус для стэнфордского теггера?

Я должен проанализировать неофициальный английский текст с большим количеством стенографий и локального малопонятного жаргона. Следовательно я думал о создании модели для стэнфордского теггера. Как я создаю свой собственный набор маркированного корпуса дл
вопрос задан: 1 July 2010 08:49
2
ответа

Поиск задания онлайн утомителен. Помогите мне автоматизировать его

Много сайтов вакансий повредили поиски, которые не позволяют Вам сузить задания уровнем опыта. Даже когда они делают, это обычно неправильно. Это требует, чтобы Вы пробрались посредством сотен регистраций, что Вы можете'...
вопрос задан: 16 June 2010 22:47
2
ответа

Библиотека PHP / Класс для подсчета Слов на Различных Языках?

Некоторое время в ближайшем будущем, я должен буду реализовать межъязыковой подсчет слов, или если это не возможно, межъязыковой счетчик символов. Подсчетом слов я имею в виду точное количество слов...
вопрос задан: 10 June 2010 04:09
2
ответа

Как Вы думаете функция “Quick Add” в работах Google Calendar?

Думаю о проекте, который мог бы использовать схожую функциональность для того, как "Быстрый Добавляют" дескрипторы, анализирующие естественный язык во что-то, что может быть понято с некоторым уровнем семантики. Мне интересно...
вопрос задан: 4 June 2010 17:03
2
ответа

PyParsing: это корректное использование setParseAction ()?

У меня есть строки как это: "MSE 2110, 3030, 4102" я хотел бы произвести: [("MSE", 2110), ("MSE", 3030), ("MSE", 4102)] Это - мой способ идти об этом, хотя я еще не вполне получил его:...
вопрос задан: 31 May 2010 01:55
2
ответа

Измерение уровня алгоритма классификации

У меня есть проблема классификации в моей руке, к которой я хотел бы обратиться с алгоритмом машинного обучения (Байесов, или Марковский, вероятно, вопрос независим на классификаторе, который будет использоваться)...
вопрос задан: 22 May 2010 22:15
2
ответа

Индексация и поиск по слоям комментариев уровня слова в Lucene

Я имею набор данных с несколькими слоями аннотации по базовому тексту, такими как часть тегов, блоки от поверхностного синтаксического анализатора, называю объекты и других от различной обработки естественного языка (...
вопрос задан: 22 May 2010 06:49
2
ответа

Java Стэнфорд обработка естественного языка: Проверка правописания

Я пытаюсь проверить орфографию точность текстовых образцов с помощью обработки естественного языка Стэнфорда. Это - просто метрика текста, не фильтр или что-либо, поэтому если это выключено немного, это прекрасно, пока ошибка...
вопрос задан: 17 May 2010 22:40
2
ответа

Анализ мнений с Python NLTK для предложений с помощью демонстрационных данных или веб-сервиса?

Я предпринимаю проект обработки естественного языка для анализа мнений. Я успешно установил NLTK для Python (походит на большую часть программного обеспечения для этого). Однако я испытываю затруднения при понимании как...
вопрос задан: 14 May 2010 13:26
2
ответа

Анализ текста с [закрытым] PHP

Я делаю проект для урока колледжа, который я посещаю. Я использую PHP для создания простого веб-приложения, которые классифицируют твиты как "положительные" (или счастливый) и "отрицательный" (или печальный) на основе ряда словарей...
вопрос задан: 7 May 2010 00:23
2
ответа

Python - pyparsing unicode символы

:) Я пытался использовать w = Word (распечатки), но он не работает. Как я должен дать спецификацию для этого. 'w' предназначен для обработки символов хинди (UTF-8), код указывает грамматику и синтаксические анализы...
вопрос задан: 27 April 2010 22:17
2
ответа

Как получить логические члены предложения с Java?

Скажем, существует предложение: 1 марта он родился. При изменении его на Он родился 1 марта. не повреждает смысл предложения, и это все еще допустимо. Перестановка слов любым другим способом...
вопрос задан: 24 April 2010 03:48
2
ответа

Генерация легких, чтобы помнить случайных идентификаторов

Поскольку все разработчики делают, мы постоянно имеем дело с некоторыми идентификаторами как часть нашей ежедневной работы. Большую часть времени это об ошибках или запросах в службу поддержки. Наше программное обеспечение, после обнаружения ошибки, созда
вопрос задан: 16 April 2010 12:34
2
ответа

Есть ли какой-либо lib для Python, который получит меня синонимы слова?

Есть ли какой-либо api/lib для Python, который получит меня синонимы слова? Например, если у меня будет слово "дом", то это возвратит "здание, постоянное место жительства, особняк, и т.д...."
вопрос задан: 15 April 2010 13:53
2
ответа

Обработка естественного языка - Идеи для [закрытых] проектов новичка

Я - новичок в обработке естественного языка и NLTK. Я очень интересуюсь обработкой естественного языка и следовательно присоединился к курсу выходных дней о AI в некотором локальном учреждении, которое требует, чтобы я сделал проект для завершения курса и
вопрос задан: 4 April 2010 14:38
2
ответа

Библиотека с открытым исходным кодом для лингвистического запроса и подсчета слов [закрытый] (LIWC)

Я ищу библиотеку с открытым исходным кодом для Лингвистического Запроса и Подсчета слов (LIWC). Что-то в Java или Python будет хорошо, хотя я открыт для использования другого языка. Делает любой знает, где я могу...
вопрос задан: 24 March 2010 22:24
2
ответа

Разница между выбором объекта, извлечением объекта, весом элемента

Я немного сбит с толку относительно того, что означают «выборка / экстрактор / весовые характеристики» и разница между ними. Когда я читаю литературу, иногда я чувствую себя потерянным, потому что нахожу термин, использованный довольно свободно, ...
вопрос задан: 30 January 2010 02:26
2
ответа

Кластеризация текста в Python

Я должен кластеризировать некоторые текстовые документы и исследовал различные варианты. Похоже, что LingPipe может кластеризировать простой текст без предшествующего преобразования (к векторному пространству и т.д.), но это - единственный инструмент I'..
вопрос задан: 24 November 2009 10:43