Может ли кто-нибудь порекомендовать POS-теггер с открытым исходным кодом для корейского языка, Индонезийский, тайский и вьетнамский?
Которые я могу использовать для тегирования данных корпуса, которые у меня есть в настоящее время. (например, stanford-postagger )
Если вы разработчик и хотите поделиться и позволить мне протестировать POS tagger, я тоже не возражаю.
С некоторыми модификациями вывода , Я пометил вьетнамские данные тегом jvntextpro
, но мне все равно хотелось бы получить больше информации о тегах POS для корейского, индонезийского и тайского языков.