Что такое хорошая библиотека Java для меток Частей речи? [закрытый]

Также как побочная заметка: Mootools имеет функцию toInt (), которая используется для любой родной строки (или float (или integer)).

"2".toInt()   // 2
"2px".toInt() // 2
2.toInt()     // 2
29
задан Glenn 18 February 2010 в 16:08
поделиться

3 ответа

Я использовал как LingPipe, так и Stanford's POS Tagger. Последний представляет собой современный POS Tagger, но, по моему опыту, он слишком медленный (хотя они предоставляют менее точные модели, которые достаточно быстры). Конечно, это всегда зависит от того, чего вы пытаетесь достичь, и всегда будет компромисс между скоростью и точностью.

Я также однажды использовал программное обеспечение NER на основе LBJ, и, хотя оно было довольно точным, исходный код был полным беспорядком. Источник LingPipe и Stanford очень чистый и хорошо документированный.

Вы также можете взглянуть на LTAG-позвоночный . Я еще не использовал его, но из описания алгоритма и из приведенной точности он, безусловно, кажется лучше, чем альтернативы, которые у вас есть.

Надеюсь, это поможет.

3
ответ дан João Silva 20 November 2019 в 01:38
поделиться

Вы хотите маркировать POS в конкретной области? Большинство тегеров общего назначения обучены на текстах новостных лент. Как правило, они не показывают хороших результатов, когда вы используете их в специфических областях (таких как биомедицинские тексты). Существуют другие маркеры, специально обученные для таких областей, например dTagger (java) для биомедицинского текста.

Для текста новостных лент очень хорош MXPOST Адвайта Ратнапархи, который я бы рекомендовал.

Другие Java-реализации:

  1. MontyLingua
  2. Berkeley Parser (не совсем POS-теггер, но все полноценные парсеры обычно включают POS-теггеры. Наберите в Google синтаксические анализаторы Java и вы найдете их множество.)
  3. QTag
  4. LBJ

OpenNLP и Lingpipe, предложенные другими авторами, также довольно достойны.

Информацию о современном состоянии POS-тегов можно найти здесь. Как вы можете видеть LTAG-Spinal (также упомянутый другим плакатом) занимает лучшее место на данный момент, но разброс между различными теггерами невелик. Я сам не использовал LTAG.

Также обратите внимание, что базовая производительность для POS-теггеров составляет около 90%. Базовый уровень означает - (а) пометить каждое слово наиболее частым POS-тегом из лексикона, и (б) пометить каждое неизвестное слово как существительное.

16
ответ дан 28 November 2019 в 02:06
поделиться

Это может помочь:

Диаграммы классов UML: Рекомендации : http://msdn.microsoft.com/en-us/library/dd409416%28VS.100%29.aspx

Свойства ассоциации

Можно ли выполнять навигацию : Если true только для одной роли, в направлении навигации появляется стрелка. ассоциация может быть прочитана в этом направлении. Это можно использовать для указания навигации по ссылкам и связей базы данных в программном обеспечении.

Свойства связей в диаграммах классов UML : http://msdn.microsoft.com/en-us/library/dd323862%28VS.100%29.aspx

alt text

Если одна роль является навигируемой, а другая нет, на связи в навигируемой появляется стрелка (7) направление.

-121--2901578-

Вот некоторые пояснения из документов Visual Studio 2015:

Диаграммы классов UML: Ссылка : https://msdn.microsoft.com/library/dd409437%28VS.140%29.aspx

UML class diagram

5 : Ассоциация : связь между членами двух классификаторов.

5a : Агрегирование : связь, представляющая отношение совместного владения. Свойство агрегирования роли владельца имеет набор Shared .

5b : Композиция : связь, представляющая отношение «вся часть». Агрегация свойство роли владельца имеет значение Composite .

9 : Обобщение : конкретный классификатор наследует часть своего определения от общего классификатор. Общий классификатор находится на конце соединителя со стрелкой. Атрибуты, связи и операции наследуются определенным классификатором. Используйте инструмент Наследование для создания обобщение между двумя классификаторами.

Package diagram

13 : Импорт : отношение между пакетами, указывающее, что пакет включает все определения другого.

14 : Зависимость : Определение или реализация зависимого классификатора может измениться, если классификатор на конце стрелки изменяется.

Realization relationship

15 : Реализация : класс реализует операции и атрибуты, определенные интерфейсом. Используйте инструмент Наследование для создания реализации между классом и интерфейсом.

16 : Реализация : альтернативное представление тех же отношений. Метка на символ леденца идентифицирует интерфейс.

Диаграммы классов UML: Рекомендации : http://msdn.microsoft.com/library/dd409416%28VS.140%29.aspx

Свойства ассоциации

Агрегирование : Это отображается как форма ромба на одном конце соединителя. Вы можете использовать его для указать, что экземпляры в агрегирующей роли принадлежат или содержат экземпляры другого.

Можно ли выполнять навигацию : Если true только для одной роли, в направлении навигации появляется стрелка.Вы можете использовать это означает возможность навигации по ссылкам и связям с базами данных в программном обеспечении.


Обобщение : Обобщение означает, что специализированный или производный тип наследует атрибуты, операции и связи общего или базового типа. Общий тип отображается в стрелке конец отношения.

Реализация : Реализация означает, что класс реализует атрибуты и операции, указанные в интерфейс. Интерфейс находится на конце соединителя со стрелкой.

Дайте мне знать, если у вас есть больше вопросов.

-121--605039-

Я использовал OpenNLP с хорошими результатами. Вы также можете получить MorphAdorner .

3
ответ дан 28 November 2019 в 02:06
поделиться
Другие вопросы по тегам:

Похожие вопросы: