Как определить предмет, возразите и другие слова?

Ответ, вероятно, что никто не думал это приоритет - это достаточно хорошо. То, что это не было зафиксировано ни с какой новой версией Платформы.NET, является индикатором того, как редко это используется - скорее всего, никто никогда не жаловался.

10
задан Stompchicken 24 August 2009 в 14:19
поделиться

5 ответов

Это открытая исследовательская проблема. Вы можете получить обзор в Википедии, http://en.wikipedia.org/wiki/Natural_language_processing . Рассмотрим такие фразы, как «Время летит, как стрела, плодовые мухи, как банан» - однозначно классифицировать слова непросто.

11
ответ дан 3 December 2019 в 16:10
поделиться

Вам следует обратиться к Natural Language Toolkit , который предназначен именно для такого рода вещей.

См. Этот раздел руководства: Категоризация и тегирование Слова - вот отрывок:

>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'),
('completely', 'RB'), ('different', 'JJ')]

«Здесь мы видим, что и - это CC, координирующее соединение; теперь и полностью являются RB, или наречия; вместо IN, предлог; что-то NN, существительное; и другое JJ, прилагательное ».

9
ответ дан 3 December 2019 в 16:10
поделиться

Я думаю, что нет "простого" способа сделать это. Вы должны построить лингвистический анализатор (что вполне возможно), однако язык как много исключительных случаев. Вот почему так сложно реализовать лингвистический анализатор.

2
ответ дан 3 December 2019 в 16:10
поделиться

The specific problem you mention, the identification of the subject and objects of a clause, is accomplished by syntactic parsing. You can get a good idea of how parsing works by using this demo of parsing software developed by Stanford University.

However, syntactic parsing does not determine the meanining of a sentence, only its structure. Determining meaning (semantics) is a very hard problem in general and there is no technology that can really 'understand' a sentence in the same way that a human would. Although there is no general solution, you may be able to do something in a very restricted subject domain. For example, is the data you want to analyse about a narrow topic with a limited set of 'things' that people talk about?

2
ответ дан 3 December 2019 в 16:10
поделиться

StompChicken дал правильный ответ на этот вопрос, но я хотел бы добавить, что понятия субъекта и объекта известны как грамматические отношения, и что Бриско и Кэрролл RASP - это синтаксический анализатор, который может выполнять дополнительный шаг по созданию списка отношений из синтаксического анализа.

Вот несколько примеров вывода их демонстрационной страницы . Это отрывок из вывода для предложения, которое начинается «Мы описываем надежный, точный, независимый от предметной области подход ...»:

(| ncsubj | | описать: 2_VV0 | | Мы: 1_PPIS2 | _)
(| dobj | | описать: 2_VV0 | | подход: 7_NN1 |)

2
ответ дан 3 December 2019 в 16:10
поделиться
Другие вопросы по тегам:

Похожие вопросы: