Также как побочная заметка: Mootools имеет функцию toInt (), которая используется для любой родной строки (или float (или integer)).
"2".toInt() // 2
"2px".toInt() // 2
2.toInt() // 2
Я использовал как LingPipe, так и Stanford's POS Tagger. Последний представляет собой современный POS Tagger, но, по моему опыту, он слишком медленный (хотя они предоставляют менее точные модели, которые достаточно быстры). Конечно, это всегда зависит от того, чего вы пытаетесь достичь, и всегда будет компромисс между скоростью и точностью.
Я также однажды использовал программное обеспечение NER на основе LBJ, и, хотя оно было довольно точным, исходный код был полным беспорядком. Источник LingPipe и Stanford очень чистый и хорошо документированный.
Вы также можете взглянуть на LTAG-позвоночный . Я еще не использовал его, но из описания алгоритма и из приведенной точности он, безусловно, кажется лучше, чем альтернативы, которые у вас есть.
Надеюсь, это поможет.
Вы хотите маркировать POS в конкретной области? Большинство тегеров общего назначения обучены на текстах новостных лент. Как правило, они не показывают хороших результатов, когда вы используете их в специфических областях (таких как биомедицинские тексты). Существуют другие маркеры, специально обученные для таких областей, например dTagger (java) для биомедицинского текста.
Для текста новостных лент очень хорош MXPOST Адвайта Ратнапархи, который я бы рекомендовал.
Другие Java-реализации:
OpenNLP и Lingpipe, предложенные другими авторами, также довольно достойны.
Информацию о современном состоянии POS-тегов можно найти здесь. Как вы можете видеть LTAG-Spinal (также упомянутый другим плакатом) занимает лучшее место на данный момент, но разброс между различными теггерами невелик. Я сам не использовал LTAG.
Также обратите внимание, что базовая производительность для POS-теггеров составляет около 90%. Базовый уровень означает - (а) пометить каждое слово наиболее частым POS-тегом из лексикона, и (б) пометить каждое неизвестное слово как существительное.
Это может помочь:
Диаграммы классов UML: Рекомендации : http://msdn.microsoft.com/en-us/library/dd409416%28VS.100%29.aspx
Свойства ассоциации
Можно ли выполнять навигацию : Если true только для одной роли, в направлении навигации появляется стрелка. ассоциация может быть прочитана в этом направлении. Это можно использовать для указания навигации по ссылкам и связей базы данных в программном обеспечении.
Свойства связей в диаграммах классов UML : http://msdn.microsoft.com/en-us/library/dd323862%28VS.100%29.aspx
-121--2901578-Если одна роль является навигируемой, а другая нет, на связи в навигируемой появляется стрелка (7) направление.
Вот некоторые пояснения из документов Visual Studio 2015:
Диаграммы классов UML: Ссылка : https://msdn.microsoft.com/library/dd409437%28VS.140%29.aspx
5 : Ассоциация : связь между членами двух классификаторов.
5a : Агрегирование : связь, представляющая отношение совместного владения. Свойство агрегирования роли владельца имеет набор Shared .
5b : Композиция : связь, представляющая отношение «вся часть». Агрегация свойство роли владельца имеет значение Composite .
9 : Обобщение : конкретный классификатор наследует часть своего определения от общего классификатор. Общий классификатор находится на конце соединителя со стрелкой. Атрибуты, связи и операции наследуются определенным классификатором. Используйте инструмент Наследование для создания обобщение между двумя классификаторами.
13 : Импорт : отношение между пакетами, указывающее, что пакет включает все определения другого.
14 : Зависимость : Определение или реализация зависимого классификатора может измениться, если классификатор на конце стрелки изменяется.
15 : Реализация : класс реализует операции и атрибуты, определенные интерфейсом. Используйте инструмент Наследование для создания реализации между классом и интерфейсом.
16 : Реализация : альтернативное представление тех же отношений. Метка на символ леденца идентифицирует интерфейс.
Диаграммы классов UML: Рекомендации : http://msdn.microsoft.com/library/dd409416%28VS.140%29.aspx
Свойства ассоциации
Агрегирование : Это отображается как форма ромба на одном конце соединителя. Вы можете использовать его для указать, что экземпляры в агрегирующей роли принадлежат или содержат экземпляры другого.
Можно ли выполнять навигацию : Если true только для одной роли, в направлении навигации появляется стрелка.Вы можете использовать это означает возможность навигации по ссылкам и связям с базами данных в программном обеспечении.
Обобщение : Обобщение означает, что специализированный или производный тип наследует атрибуты, операции и связи общего или базового типа. Общий тип отображается в стрелке конец отношения.
Реализация : Реализация означает, что класс реализует атрибуты и операции, указанные в интерфейс. Интерфейс находится на конце соединителя со стрелкой.
Дайте мне знать, если у вас есть больше вопросов.
-121--605039-Я использовал OpenNLP с хорошими результатами. Вы также можете получить MorphAdorner .