Ответ, вероятно, что никто не думал это приоритет - это достаточно хорошо. То, что это не было зафиксировано ни с какой новой версией Платформы.NET, является индикатором того, как редко это используется - скорее всего, никто никогда не жаловался.
Это открытая исследовательская проблема. Вы можете получить обзор в Википедии, http://en.wikipedia.org/wiki/Natural_language_processing . Рассмотрим такие фразы, как «Время летит, как стрела, плодовые мухи, как банан» - однозначно классифицировать слова непросто.
Вам следует обратиться к Natural Language Toolkit , который предназначен именно для такого рода вещей.
См. Этот раздел руководства: Категоризация и тегирование Слова - вот отрывок:
>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'),
('completely', 'RB'), ('different', 'JJ')]
«Здесь мы видим, что и - это CC, координирующее соединение; теперь и полностью являются RB, или наречия; вместо IN, предлог; что-то NN, существительное; и другое JJ, прилагательное ».
Я думаю, что нет "простого" способа сделать это. Вы должны построить лингвистический анализатор (что вполне возможно), однако язык как много исключительных случаев. Вот почему так сложно реализовать лингвистический анализатор.
The specific problem you mention, the identification of the subject and objects of a clause, is accomplished by syntactic parsing. You can get a good idea of how parsing works by using this demo of parsing software developed by Stanford University.
However, syntactic parsing does not determine the meanining of a sentence, only its structure. Determining meaning (semantics) is a very hard problem in general and there is no technology that can really 'understand' a sentence in the same way that a human would. Although there is no general solution, you may be able to do something in a very restricted subject domain. For example, is the data you want to analyse about a narrow topic with a limited set of 'things' that people talk about?
StompChicken дал правильный ответ на этот вопрос, но я хотел бы добавить, что понятия субъекта и объекта известны как грамматические отношения, и что Бриско и Кэрролл RASP - это синтаксический анализатор, который может выполнять дополнительный шаг по созданию списка отношений из синтаксического анализа.
Вот несколько примеров вывода их демонстрационной страницы . Это отрывок из вывода для предложения, которое начинается «Мы описываем надежный, точный, независимый от предметной области подход ...»:
(| ncsubj | | описать: 2_VV0 | | Мы: 1_PPIS2 | _)
(| dobj | | описать: 2_VV0 | | подход: 7_NN1 |)