Какой набор тегов используется в OpenNLP? Немецкая модель maxent?

в настоящее время я использую инструменты OpenNLP для PoS-тегирования немецких предложений, с моделью maxent, указанной на их сайте загрузки :

de      POS Tagger      Maxent model trained on tiger corpus.   de-pos-maxent.bin

Это работает очень хорошо и я получил следующие результаты:

Diese, Community, bietet, Teilnehmern, der, Veranstaltungen, die, Möglichkeit ...
PDAT, FM, VVFIN, NN, ART, NN, ART, NN ...

С помеченными предложениями я хочу произвести некоторую дальнейшую обработку, где мне нужно знать значение отдельных тегов. К сожалению, поиск наборов тегов в OpenNLP-Wiki не очень полезен, поскольку здесь говорится:

TODO: Add more tag sets, also for non-english languages

Кто-нибудь знает, где я могу найти набор тегов, используемый в немецкой модели maxent?

8
задан Ken Bloom 5 July 2011 в 15:48
поделиться