@Suzana_K работает. Но у меня есть некоторые случаи в KeyError как упоминание @ Clock Slave.
Преобразовать теги treebank в тег Wordnet
from nltk.corpus import wordnet
def get_wordnet_pos(treebank_tag):
if treebank_tag.startswith('J'):
return wordnet.ADJ
elif treebank_tag.startswith('V'):
return wordnet.VERB
elif treebank_tag.startswith('N'):
return wordnet.NOUN
elif treebank_tag.startswith('R'):
return wordnet.ADV
else:
return None # for easy if-statement
Теперь мы вводим pos только в функцию lemmatize, только если у нас есть тег wordnet
from nltk.stem.wordnet import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
tagged = nltk.pos_tag(tokens)
for word, tag in tagged:
wntag = get_wordnet_pos(tag)
if wntag is None:# not supply tag in case of None
lemma = lemmatizer.lemmatize(word)
else:
lemma = lemmatizer.lemmatize(word, pos=wntag)
После некоторой работы я нашел решение. Просто поместите или измените приведенный ниже код в middleware.json file
"parse": {
"express-xml-bodyparser": {"params": { "explicitArray": false , "explicitRoot": false}}
},