в настоящее время я использую инструменты OpenNLP для PoS-тегирования немецких предложений, с моделью maxent, указанной на их сайте загрузки :
de POS Tagger Maxent model trained on tiger corpus. de-pos-maxent.bin
Это работает очень хорошо и я получил следующие результаты:
Diese, Community, bietet, Teilnehmern, der, Veranstaltungen, die, Möglichkeit ... PDAT, FM, VVFIN, NN, ART, NN, ART, NN ...
С помеченными предложениями я хочу произвести некоторую дальнейшую обработку, где мне нужно знать значение отдельных тегов. К сожалению, поиск наборов тегов в OpenNLP-Wiki не очень полезен, поскольку здесь говорится:
TODO: Add more tag sets, also for non-english languages
Кто-нибудь знает, где я могу найти набор тегов, используемый в немецкой модели maxent?